So fragen Sie eine Wissensdatenbank ab und generieren Antworten auf Grundlage der abgerufenen Daten

Wichtig

Ein Integritätsschutz wird nur auf die Eingabe und die generierte Antwort des LLM angewendet. Er wird nicht auf die Referenzen angewendet, die zur Laufzeit aus Knowledge Bases abgerufen wurden.

Nachdem Ihre Wissensdatenbank eingerichtet ist, können Sie sie abfragen und Antworten basierend auf den aus Ihren Quelldaten abgerufenen Blöcken generieren, indem Sie die RetrieveAndGenerate-API-Operation verwenden. Die Antworten werden mit Zitate der ursprünglichen Quelldaten zurückgegeben. Sie können anstelle des standardmäßigen Rankers für Wissensdatenbanken für Amazon Bedrock auch ein Reranker-Modell verwenden, um Quellenblöcke beim Abrufen nach Relevanz zu ordnen.

Einschränkungen multimodaler Inhalte

RetrieveAndGeneratebietet begrenzte Unterstützung für multimodale Inhalte. Bei der Verwendung von Nova Multimodal Embeddings ist die RAG-Funktionalität nur auf Textinhalte beschränkt. Verwenden Sie BDA mit Modellen zur Texteinbettung, um eine vollständige multimodale Unterstützung einschließlich Audio- und Videoverarbeitung zu erhalten. Details hierzu finden Sie unter Aufbau einer Wissensdatenbank für multimodale Inhalte.

Anmerkung

Bilder, die von der Retrieve-Antwort während des RetrieveAndGenerate-Flows zurückgegeben werden, sind im Prompt für die Antwortgenerierung enthalten. Die RetrieveAndGenerate-Antwort kann keine Bilder enthalten, aber sie kann die Quellen angeben, die die Bilder enthalten.

Wählen Sie die Registerkarte für Ihre bevorzugte Methode aus und führen Sie dann die Schritte aus, um zu erfahren, wie Sie Ihre Wissensdatenbank abfragen:

Console

Testen Ihrer Wissensdatenbank

Melden Sie sich bei der AWS-Managementkonsole mit einer IAM-Identität an, die berechtigt ist, die Amazon Bedrock-Konsole zu verwenden. Öffnen Sie dann die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock.
Wählen Sie im linken Navigationsbereich Wissensdatenbank aus.
Führen Sie im Abschnitt Wissensdatenbanken eine der folgenden Aktionen aus:
- Aktivieren Sie das Optionsfeld neben der Wissensdatenbank, die Sie testen möchten, und wählen Sie Wissensdatenbank testen. Ein Testfenster wird von rechts erweitert.
- Wählen Sie die Wissensdatenbank aus, die Sie testen möchten. Ein Testfenster wird von rechts erweitert.
Deaktivieren Sie die Option Antworten für Ihre Anfrage generieren, um direkt aus Ihrer Wissensdatenbank abgerufene Informationen zurückzugeben. Amazon Bedrock generiert Antworten auf Grundlage Ihrer Datenquellen und zitiert die bereitgestellten Informationen mit Fußnoten.
Klicken Sie auf Modell auswählen, um ein Modell auszuwählen, das für die Generierung von Antworten verwendet werden soll. Klicken Sie dann auf Anwenden.
(Optional) Klicken Sie auf das Konfigurationssymbol ( ), um Konfigurationen zu öffnen. Weitere Informationen zu Konfigurationen finden Sie unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.
Geben Sie eine Abfrage in das Textfeld im Chatfenster ein und wählen Sie Ausführen aus, um Antworten aus der Wissensdatenbank zurückzugeben.
Wählen Sie eine Fußnote aus, um einen Auszug aus der zitierten Quelle für diesen Teil der Antwort anzuzeigen. Klicken Sie auf den Link, um zu dem S3-Objekt zu navigieren, das die Datei enthält.
Klicken Sie auf Quelldetails anzeigen, um Details zu den zurückgegebenen Blöcken anzuzeigen.
- Erweitern Sie den Bereich Abfragekonfigurationen, um die Konfigurationen anzuzeigen, die Sie für die Abfrage festgelegt haben.
- Um Details zu einem Quellblock anzuzeigen, erweitern Sie ihn, indem Sie auf den Rechtspfeil ( ) neben dem Block klicken. Die folgenden Informationen können angezeigt werden:
  - Der Rohtext aus dem Quellblock. Um diesen Text zu kopieren, klicken Sie auf das Kopiersymbol ( ). Wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben, klicken Sie auf das externe Linksymbol ( ), um zu dem S3-Objekt zu navigieren, das die Datei enthält.
  - Die mit dem Quellblock verknüpften Metadaten, wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben. Die attribute/field Schlüssel und Werte sind in der .metadata.json Datei definiert, die dem Quelldokument zugeordnet ist. Weitere Informationen finden Sie im Abschnitt Metadaten und Filterung unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.

Chat-Optionen

Klicken Sie auf Modell ändern, um ein anderes Modell für die Antwortgenerierung auszuwählen. Wenn Sie das Modell ändern, wird der Text im Chatfenster vollständig gelöscht.
Wechseln Sie zum direkten Abrufen von Quellblöcken, indem Sie die Option Antworten generieren deaktivieren. Wenn Sie die Einstellung ändern, wird der Text im Chatfenster vollständig gelöscht.
Um das Chat-Fenster zu löschen, wählen Sie das Besensymbol ( ).
Um die gesamte Ausgabe im Chat-Fenster zu kopieren, wählen Sie das Kopiersymbol ( ).

API

Senden Sie eine RetrieveAndGenerate-Anfrage mit einem Runtime-Endpunkt für Agenten für Amazon Bedrock, um eine Wissensdatenbank abzufragen und mithilfe eines Basismodells Antworten auf Grundlage der Ergebnisse aus den Datenquellen zu generieren.

Die RetrieveAndGenerateStream-API gibt Daten in einem Streaming-Format zurück und ermöglicht Ihnen, auf die generierten Antworten in Blöcken zuzugreifen, ohne auf das gesamte Ergebnis warten zu müssen.

Die folgenden Felder sind erforderlich:

Anmerkung

Die API-Antwort enthält Zitationsereignisse. Das citation-Mitglied wurde als veraltet gekennzeichnet. Stattdessen empfehlen wir, die Felder generatedResponse und retrievedReferences zu verwenden. Weitere Informationen finden Sie unter CitationEvent.

Feld	Grundlegende Beschreibung
input	Enthält ein `text`-Feld zur Angabe der Abfrage.
retrieveAndGenerateKonfiguration	Enthält eine RetrieveAndGenerateConfiguration, die Konfigurationen für den Abruf und die Generierung spezifiziert. Weitere Details finden Sie unten.

Die folgenden Felder sind optional:

Feld	Anwendungsfall
sessionId	Verwenden Sie denselben Wert wie in einer vorherigen Sitzung, um diese Sitzung fortzusetzen und den daraus resultierenden Kontext für das Modell beizubehalten.
sessionConfiguration	Um einen benutzerdefinierten KMS-Schlüssel für die Verschlüsselung der Sitzung hinzuzufügen.

Schließt das knowledgeBaseConfiguration Feld in das RetrieveAndGenerateConfigurationein. Dieses Feld ist einem KnowledgeBaseRetrieveAndGenerateConfigurationObjekt zugeordnet, das die folgenden Felder enthält:

Die folgenden Felder sind erforderlich:

Feld	Grundlegende Beschreibung
knowledgeBaseId	Die ID der abzufragenden Wissensdatenbank.
modelArn	Der ARN des Basismodells oder Inferenzprofils, das für die Generierung verwendet werden soll.

Die folgenden Felder sind optional:

Feld	Anwendungsfall
retrievalConfiguration	Um Abfragekonfigurationen für die Anpassung der Vektorsuche einzubeziehen. Weitere Informationen finden Sie unter KnowledgeBaseRetrievalConfiguration.
orchestrationConfiguration	Um Konfigurationen dafür anzugeben, wie das Modell den Prompt vor einem Abruf und einer Generierung verarbeitet. Weitere Informationen finden Sie unter OrchestrationConfiguration.
generationConfiguration	Um Konfigurationen für die Antwortgenerierung anzugeben. Weitere Informationen finden Sie unter GenerationConfiguration.

Sie können ein Ranking-Modell gegenüber dem standardmäßigen Rankingmodell von Amazon Bedrock Knowledge Bases verwenden, indem Sie das rerankingConfiguration Feld innerhalb von einbeziehen. KnowledgeBaseVectorSearchConfiguration KnowledgeBaseRetrievalConfiguration Das rerankingConfiguration Feld ist einem VectorSearchRerankingConfigurationObjekt zugeordnet, in dem Sie das zu verwendende Ranking-Modell, alle zusätzlichen einzuschließenden Anforderungsfelder, Metadatenattribute zum Herausfiltern von Dokumenten bei der Neueinstufung und die Anzahl der Ergebnisse angeben können, die nach der Neurangierung zurückgegeben werden sollen. Weitere Informationen finden Sie unter VectorSearchRerankingConfiguration.

Anmerkung

Wenn der von Ihnen angegebene numberOfRerankedResults Wert größer als der numberOfResults Wert in ist, ist die maximale Anzahl von Ergebnissen KnowledgeBaseVectorSearchConfiguration, die zurückgegeben werden, der Wert für. numberOfResults Eine Ausnahme ist, wenn Sie die Zerlegung von Abfragen verwenden (weitere Informationen finden Sie im Abschnitt Abfrageänderungen unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an. Wenn Sie die Zerlegung von Abfragen verwenden, können die numberOfRerankedResults bis zu fünfmal so hoch wie die numberOfResults sein.

Die Antwort gibt die generierte Antwort im output-Feld und die angegebenen Quellblöcke als Array im Feld citations zurück. Jedes Zitations-Objekt enthält die folgenden Felder:

Feld	Grundlegende Beschreibung
generatedResponsePart	Im `textResponsePart`-Feld ist der `text` enthalten, auf den sich die Zitation bezieht. Das `span`-Feld stellt die Indizes für den Anfang und das Ende des Teils der Ausgabe bereit, der eine Zitation enthält.
retrievedReferences	Ein Array von RetrievedReferenceObjekten, von denen jedes einen Quellblock enthält, `content` der dem Dokument `metadata` zugeordnet ist, und den URI oder die URL `location` des Dokuments in der Datenquelle. Wenn es sich bei dem Inhalt um ein Bild handelt, wird die Daten-URI des base64-codierten Inhalts im folgenden Format zurückgegeben: `data:image/jpeg;base64,${base64-encoded string}`.

Die Antwort gibt außerdem einen sessionId-Wert zurück, den Sie in einer anderen Anfrage wiederverwenden können, um dieselbe Konversation aufrechtzuerhalten.

Wenn Sie eine guardrailConfiguration in die Anfrage aufgenommen haben, informiert Sie das guardrailAction-Feld darüber, ob der Inhalt blockiert wurde oder nicht.

Wenn die abgerufenen Daten Bilder enthalten, gibt die Antwort außerdem die folgenden Antwort-Header zurück, die Metadaten für Quellblöcke enthalten, die in der Antwort zurückgegeben wurden:

x-amz-bedrock-kb-byte-content-source – Enthält die Amazon-S3-URI des Bildes.
x-amz-bedrock-kb-description – Enthält die base64-codierte Zeichenfolge für das Bild.

Anmerkung

Sie können beim Konfigurieren von Metadatenfiltern nicht nach diesen Metadaten-Antwort-Headern filtern.

Anmerkung

Wenn Sie beim Generieren von Antworten die Fehlermeldung erhalten, dass der Prompt die Zeichenbeschränkung überschreitet, können Sie den Prompt wie folgt kürzen:

Reduzieren Sie die maximale Anzahl der abgerufenen Ergebnisse (dadurch wird das, was für den Platzhalter $search_results$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).
Erstellen Sie die Datenquelle mit einer Chunking-Strategie neu, bei der kleinere Blöcke verwendet werden (dadurch wird das, was für den Platzhalter $search_results$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).
Kürzen Sie die Vorlage für den Prompt.
Kürzen Sie die Benutzerabfrage (dadurch wird das, was für den Platzhalter $query$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Abrufen einer Wissensdatenbank und Datenabruf

Generieren einer Abfrage für strukturierte Daten