So fragen Sie eine Wissensdatenbank ab und generieren Antworten auf Grundlage der abgerufenen Daten - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So fragen Sie eine Wissensdatenbank ab und generieren Antworten auf Grundlage der abgerufenen Daten

Wichtig

Ein Integritätsschutz wird nur auf die Eingabe und die generierte Antwort des LLM angewendet. Er wird nicht auf die Referenzen angewendet, die zur Laufzeit aus Knowledge Bases abgerufen wurden.

Nachdem Ihre Wissensdatenbank eingerichtet ist, können Sie sie abfragen und Antworten basierend auf den aus Ihren Quelldaten abgerufenen Blöcken generieren, indem Sie die RetrieveAndGenerate-API-Operation verwenden. Die Antworten werden mit Zitate der ursprünglichen Quelldaten zurückgegeben. Sie können anstelle des standardmäßigen Rankers für Wissensdatenbanken für Amazon Bedrock auch ein Reranker-Modell verwenden, um Quellenblöcke beim Abrufen nach Relevanz zu ordnen.

Einschränkungen multimodaler Inhalte

RetrieveAndGeneratebietet begrenzte Unterstützung für multimodale Inhalte. Bei der Verwendung von Nova Multimodal Embeddings ist die RAG-Funktionalität nur auf Textinhalte beschränkt. Verwenden Sie BDA mit Modellen zur Texteinbettung, um eine vollständige multimodale Unterstützung einschließlich Audio- und Videoverarbeitung zu erhalten. Details hierzu finden Sie unter Aufbau einer Wissensdatenbank für multimodale Inhalte.

Anmerkung

Bilder, die von der Retrieve-Antwort während des RetrieveAndGenerate-Flows zurückgegeben werden, sind im Prompt für die Antwortgenerierung enthalten. Die RetrieveAndGenerate-Antwort kann keine Bilder enthalten, aber sie kann die Quellen angeben, die die Bilder enthalten.

Wählen Sie die Registerkarte für Ihre bevorzugte Methode aus und führen Sie dann die Schritte aus, um zu erfahren, wie Sie Ihre Wissensdatenbank abfragen:

Console
Testen Ihrer Wissensdatenbank
  1. Melden Sie sich bei der AWS-Managementkonsole mit einer IAM-Identität an, die berechtigt ist, die Amazon Bedrock-Konsole zu verwenden. Öffnen Sie dann die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock.

  2. Wählen Sie im linken Navigationsbereich Wissensdatenbank aus.

  3. Führen Sie im Abschnitt Wissensdatenbanken eine der folgenden Aktionen aus:

    • Aktivieren Sie das Optionsfeld neben der Wissensdatenbank, die Sie testen möchten, und wählen Sie Wissensdatenbank testen. Ein Testfenster wird von rechts erweitert.

    • Wählen Sie die Wissensdatenbank aus, die Sie testen möchten. Ein Testfenster wird von rechts erweitert.

  4. Deaktivieren Sie die Option Antworten für Ihre Anfrage generieren, um direkt aus Ihrer Wissensdatenbank abgerufene Informationen zurückzugeben. Amazon Bedrock generiert Antworten auf Grundlage Ihrer Datenquellen und zitiert die bereitgestellten Informationen mit Fußnoten.

  5. Klicken Sie auf Modell auswählen, um ein Modell auszuwählen, das für die Generierung von Antworten verwendet werden soll. Klicken Sie dann auf Anwenden.

  6. (Optional) Klicken Sie auf das Konfigurationssymbol ( Three horizontal sliders with adjustable circular controls for settings or parameters. ), um Konfigurationen zu öffnen. Weitere Informationen zu Konfigurationen finden Sie unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.

  7. Geben Sie eine Abfrage in das Textfeld im Chatfenster ein und wählen Sie Ausführen aus, um Antworten aus der Wissensdatenbank zurückzugeben.

  8. Wählen Sie eine Fußnote aus, um einen Auszug aus der zitierten Quelle für diesen Teil der Antwort anzuzeigen. Klicken Sie auf den Link, um zu dem S3-Objekt zu navigieren, das die Datei enthält.

  9. Klicken Sie auf Quelldetails anzeigen, um Details zu den zurückgegebenen Blöcken anzuzeigen.

    • Erweitern Sie den Bereich Abfragekonfigurationen, um die Konfigurationen anzuzeigen, die Sie für die Abfrage festgelegt haben.

    • Um Details zu einem Quellblock anzuzeigen, erweitern Sie ihn, indem Sie auf den Rechtspfeil ( Play button icon with a triangular shape pointing to the right. ) neben dem Block klicken. Die folgenden Informationen können angezeigt werden:

      • Der Rohtext aus dem Quellblock. Um diesen Text zu kopieren, klicken Sie auf das Kopiersymbol ( Icon representing a crop or resize function, with two overlapping rectangles. ). Wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben, klicken Sie auf das externe Linksymbol ( Icon of a square with an arrow pointing outward from its top-right corner. ), um zu dem S3-Objekt zu navigieren, das die Datei enthält.

      • Die mit dem Quellblock verknüpften Metadaten, wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben. Die attribute/field Schlüssel und Werte sind in der .metadata.json Datei definiert, die dem Quelldokument zugeordnet ist. Weitere Informationen finden Sie im Abschnitt Metadaten und Filterung unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.

Chat-Optionen
  • Klicken Sie auf Modell ändern, um ein anderes Modell für die Antwortgenerierung auszuwählen. Wenn Sie das Modell ändern, wird der Text im Chatfenster vollständig gelöscht.

  • Wechseln Sie zum direkten Abrufen von Quellblöcken, indem Sie die Option Antworten generieren deaktivieren. Wenn Sie die Einstellung ändern, wird der Text im Chatfenster vollständig gelöscht.

  • Um das Chat-Fenster zu löschen, wählen Sie das Besensymbol ( Magnifying glass icon with a checkmark inside, symbolizing search or inspection. ).

  • Um die gesamte Ausgabe im Chat-Fenster zu kopieren, wählen Sie das Kopiersymbol ( Icon representing a crop or resize function, with two overlapping rectangles. ).

API

Senden Sie eine RetrieveAndGenerate-Anfrage mit einem Runtime-Endpunkt für Agenten für Amazon Bedrock, um eine Wissensdatenbank abzufragen und mithilfe eines Basismodells Antworten auf Grundlage der Ergebnisse aus den Datenquellen zu generieren.

Die RetrieveAndGenerateStream-API gibt Daten in einem Streaming-Format zurück und ermöglicht Ihnen, auf die generierten Antworten in Blöcken zuzugreifen, ohne auf das gesamte Ergebnis warten zu müssen.

Die folgenden Felder sind erforderlich:

Anmerkung

Die API-Antwort enthält Zitationsereignisse. Das citation-Mitglied wurde als veraltet gekennzeichnet. Stattdessen empfehlen wir, die Felder generatedResponse und retrievedReferences zu verwenden. Weitere Informationen finden Sie unter CitationEvent.

Feld Grundlegende Beschreibung
input Enthält ein text-Feld zur Angabe der Abfrage.
retrieveAndGenerateKonfiguration Enthält eine RetrieveAndGenerateConfiguration, die Konfigurationen für den Abruf und die Generierung spezifiziert. Weitere Details finden Sie unten.

Die folgenden Felder sind optional:

Feld Anwendungsfall
sessionId Verwenden Sie denselben Wert wie in einer vorherigen Sitzung, um diese Sitzung fortzusetzen und den daraus resultierenden Kontext für das Modell beizubehalten.
sessionConfiguration Um einen benutzerdefinierten KMS-Schlüssel für die Verschlüsselung der Sitzung hinzuzufügen.

Schließt das knowledgeBaseConfiguration Feld in das RetrieveAndGenerateConfigurationein. Dieses Feld ist einem KnowledgeBaseRetrieveAndGenerateConfigurationObjekt zugeordnet, das die folgenden Felder enthält:

  • Die folgenden Felder sind erforderlich:

    Feld Grundlegende Beschreibung
    knowledgeBaseId Die ID der abzufragenden Wissensdatenbank.
    modelArn Der ARN des Basismodells oder Inferenzprofils, das für die Generierung verwendet werden soll.
  • Die folgenden Felder sind optional:

    Feld Anwendungsfall
    retrievalConfiguration Um Abfragekonfigurationen für die Anpassung der Vektorsuche einzubeziehen. Weitere Informationen finden Sie unter KnowledgeBaseRetrievalConfiguration.
    orchestrationConfiguration Um Konfigurationen dafür anzugeben, wie das Modell den Prompt vor einem Abruf und einer Generierung verarbeitet. Weitere Informationen finden Sie unter OrchestrationConfiguration.
    generationConfiguration Um Konfigurationen für die Antwortgenerierung anzugeben. Weitere Informationen finden Sie unter GenerationConfiguration.

Sie können ein Ranking-Modell gegenüber dem standardmäßigen Rankingmodell von Amazon Bedrock Knowledge Bases verwenden, indem Sie das rerankingConfiguration Feld innerhalb von einbeziehen. KnowledgeBaseVectorSearchConfigurationKnowledgeBaseRetrievalConfiguration Das rerankingConfiguration Feld ist einem VectorSearchRerankingConfigurationObjekt zugeordnet, in dem Sie das zu verwendende Ranking-Modell, alle zusätzlichen einzuschließenden Anforderungsfelder, Metadatenattribute zum Herausfiltern von Dokumenten bei der Neueinstufung und die Anzahl der Ergebnisse angeben können, die nach der Neurangierung zurückgegeben werden sollen. Weitere Informationen finden Sie unter VectorSearchRerankingConfiguration.

Anmerkung

Wenn der von Ihnen angegebene numberOfRerankedResults Wert größer als der numberOfResults Wert in ist, ist die maximale Anzahl von Ergebnissen KnowledgeBaseVectorSearchConfiguration, die zurückgegeben werden, der Wert für. numberOfResults Eine Ausnahme ist, wenn Sie die Zerlegung von Abfragen verwenden (weitere Informationen finden Sie im Abschnitt Abfrageänderungen unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an. Wenn Sie die Zerlegung von Abfragen verwenden, können die numberOfRerankedResults bis zu fünfmal so hoch wie die numberOfResults sein.

Die Antwort gibt die generierte Antwort im output-Feld und die angegebenen Quellblöcke als Array im Feld citations zurück. Jedes Zitations-Objekt enthält die folgenden Felder:

Feld Grundlegende Beschreibung
generatedResponsePart Im textResponsePart-Feld ist der text enthalten, auf den sich die Zitation bezieht. Das span-Feld stellt die Indizes für den Anfang und das Ende des Teils der Ausgabe bereit, der eine Zitation enthält.
retrievedReferences Ein Array von RetrievedReferenceObjekten, von denen jedes einen Quellblock enthält, content der dem Dokument metadata zugeordnet ist, und den URI oder die URL location des Dokuments in der Datenquelle. Wenn es sich bei dem Inhalt um ein Bild handelt, wird die Daten-URI des base64-codierten Inhalts im folgenden Format zurückgegeben: data:image/jpeg;base64,${base64-encoded string}.

Die Antwort gibt außerdem einen sessionId-Wert zurück, den Sie in einer anderen Anfrage wiederverwenden können, um dieselbe Konversation aufrechtzuerhalten.

Wenn Sie eine guardrailConfiguration in die Anfrage aufgenommen haben, informiert Sie das guardrailAction-Feld darüber, ob der Inhalt blockiert wurde oder nicht.

Wenn die abgerufenen Daten Bilder enthalten, gibt die Antwort außerdem die folgenden Antwort-Header zurück, die Metadaten für Quellblöcke enthalten, die in der Antwort zurückgegeben wurden:

  • x-amz-bedrock-kb-byte-content-source – Enthält die Amazon-S3-URI des Bildes.

  • x-amz-bedrock-kb-description – Enthält die base64-codierte Zeichenfolge für das Bild.

Anmerkung

Sie können beim Konfigurieren von Metadatenfiltern nicht nach diesen Metadaten-Antwort-Headern filtern.

Anmerkung

Wenn Sie beim Generieren von Antworten die Fehlermeldung erhalten, dass der Prompt die Zeichenbeschränkung überschreitet, können Sie den Prompt wie folgt kürzen: