Abrufen einer Wissensdatenbank und Datenabruf - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Abrufen einer Wissensdatenbank und Datenabruf

Wichtig

Ein Integritätsschutz wird nur auf die Eingabe und die generierte Antwort des LLM angewendet. Er wird nicht auf die Referenzen angewendet, die zur Laufzeit aus Knowledge Bases abgerufen wurden.

Nachdem Ihre Wissensdatenbank eingerichtet ist, können Sie sie abfragen und Blöcke aus Ihren Quelldaten abrufen, die für die Abfrage relevant sind, indem Sie die Retrieve-API-Operation verwenden. Sie können anstelle des standardmäßigen Rankers für Wissensdatenbanken für Amazon Bedrock auch ein Reranker-Modell verwenden, um Quellenblöcke beim Abrufen nach Relevanz zu ordnen.

Wählen Sie die Registerkarte für Ihre bevorzugte Methode aus und führen Sie dann die Schritte aus, um zu erfahren, wie Sie Ihre Wissensdatenbank abfragen:

Console
Testen Ihrer Wissensdatenbank
  1. Melden Sie sich bei der AWS-Managementkonsole mit einer IAM-Identität an, die berechtigt ist, die Amazon Bedrock-Konsole zu verwenden. Öffnen Sie dann die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock.

  2. Wählen Sie im linken Navigationsbereich Wissensdatenbank aus.

  3. Führen Sie im Abschnitt Wissensdatenbanken eine der folgenden Aktionen aus:

    • Aktivieren Sie das Optionsfeld neben der Wissensdatenbank, die Sie testen möchten, und wählen Sie Wissensdatenbank testen. Ein Testfenster wird von rechts erweitert.

    • Wählen Sie die Wissensdatenbank aus, die Sie testen möchten. Ein Testfenster wird von rechts erweitert.

  4. Deaktivieren Sie die Option Antworten für Ihre Anfrage generieren im Testfenster, um direkt aus Ihrer Wissensdatenbank abgerufene Informationen zurückzugeben.

  5. (Optional) Klicken Sie auf das Konfigurationssymbol ( Three horizontal sliders with adjustable circular controls for settings or parameters. ), um Konfigurationen zu öffnen. Weitere Informationen zu Konfigurationen finden Sie unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.

  6. Geben Sie eine Abfrage in das Textfeld im Chatfenster ein und wählen Sie Ausführen aus, um Antworten aus der Wissensdatenbank zurückzugeben.

  7. Die Quell-blöcke werden direkt in der Reihenfolge ihrer Relevanz zurückgegeben. Aus Ihrer Datenquelle extrahierte Bilder können auch als Quellblock zurückgegeben werden.

  8. Klicken Sie auf Quelldetails anzeigen, um Details zu den zurückgegebenen Blöcken anzuzeigen.

    • Erweitern Sie den Bereich Abfragekonfigurationen, um die Konfigurationen anzuzeigen, die Sie für die Abfrage festgelegt haben.

    • Um Details zu einem Quellblock anzuzeigen, erweitern Sie ihn, indem Sie auf den Rechtspfeil ( Play button icon with a triangular shape pointing to the right. ) neben dem Block klicken. Die folgenden Informationen können angezeigt werden:

      • Der Rohtext aus dem Quellblock. Um diesen Text zu kopieren, klicken Sie auf das Kopiersymbol ( Icon representing a crop or resize function, with two overlapping rectangles. ). Wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben, klicken Sie auf das externe Linksymbol ( Icon of a square with an arrow pointing outward from its top-right corner. ), um zu dem S3-Objekt zu navigieren, das die Datei enthält.

      • Die mit dem Quellblock verknüpften Metadaten, wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben. Die attribute/field Schlüssel und Werte sind in der .metadata.json Datei definiert, die dem Quelldokument zugeordnet ist. Weitere Informationen finden Sie im Abschnitt Metadaten und Filterung unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.

Chat-Optionen
  • Wechseln Sie zur Generierung von Antworten auf Grundlage der abgerufenen Quellblöcke, indem Sie die Option Antworten generieren aktivieren. Wenn Sie die Einstellung ändern, wird der Text im Chatfenster vollständig gelöscht.

  • Um das Chat-Fenster zu löschen, wählen Sie das Besensymbol ( Magnifying glass icon with a checkmark inside, symbolizing search or inspection. ).

  • Um die gesamte Ausgabe im Chat-Fenster zu kopieren, wählen Sie das Kopiersymbol ( Icon representing a crop or resize function, with two overlapping rectangles. ).

API

Senden Sie eine Retrieve-Anfrage an einen Runtime-Endpunkt für Agenten für Amazon Bedrock, um eine Wissensdatenbank abzufragen und nur relevanten Text aus Datenquellen zurückzugeben.

Die folgenden Felder sind erforderlich:

Feld Grundlegende Beschreibung
knowledgeBaseId So geben Sie die abzufragende Wissensdatenbank an.
retrievalQuery Enthält ein text-Feld zur Angabe der Abfrage.
guardrailsConfiguration So fügen Sie guardrailsConfiguration-Felder wie guardrailsId und guardrailsVersion ein, um Ihren Integritätsschutz in der Anfrage zu verwenden

Die folgenden Felder sind optional:

Feld Anwendungsfall
nextToken Um den nächsten Stapel von Antworten zurückzugeben (siehe Antwortfelder unten).
retrievalConfiguration Um Abfragekonfigurationen für die Anpassung der Vektorsuche einzubeziehen. Weitere Informationen finden Sie unter KnowledgeBaseVectorSearchConfiguration.

Sie können ein Ranking-Modell gegenüber dem standardmäßigen Rankingmodell von Amazon Bedrock Knowledge Bases verwenden, indem Sie das rerankingConfiguration Feld in die aufnehmen. KnowledgeBaseVectorSearchConfiguration Das rerankingConfiguration Feld ist einem VectorSearchRerankingConfigurationObjekt zugeordnet, in dem Sie das zu verwendende Ranking-Modell, alle zusätzlichen einzuschließenden Anforderungsfelder, Metadatenattribute zum Herausfiltern von Dokumenten bei der Neueinstufung und die Anzahl der Ergebnisse angeben können, die nach der Neurangierung zurückgegeben werden sollen. Weitere Informationen finden Sie unter VectorSearchRerankingConfiguration.

Anmerkung

Wenn der von Ihnen angegebene numberOfRerankedResults Wert größer als der numberOfResults Wert in ist, ist die maximale Anzahl von Ergebnissen KnowledgeBaseVectorSearchConfiguration, die zurückgegeben werden, der Wert für. numberOfResults Eine Ausnahme ist, wenn Sie die Zerlegung von Abfragen verwenden (weitere Informationen finden Sie im Abschnitt Abfrageänderungen unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an. Wenn Sie die Zerlegung von Abfragen verwenden, können die numberOfRerankedResults bis zu fünfmal so hoch wie die numberOfResults sein.

Die Antwort gibt die Quellblöcke aus der Datenquelle als Array von KnowledgeBaseRetrievalResultObjekten im retrievalResults Feld zurück. Jedes KnowledgeBaseRetrievalResultenthält die folgenden Felder:

Feld Description
Inhalt Enthält einen Textquellenblock im text oder einen Bildquellenblock im byteContent-Feld. Wenn es sich bei dem Inhalt um ein Bild handelt, wird die Daten-URI des base64-codierten Inhalts im folgenden Format zurückgegeben: data:image/jpeg;base64,${base64-encoded string}.
Metadaten Enthält jedes Metadatenattribut als Schlüssel und den Metadatenwert als einen JSON-Wert, dem der Schlüssel zugeordnet ist.
location Enthält den URI oder die URL des Dokuments, zu dem der Quellblock gehört.
score Der Relevanzwert des Dokuments. Sie können diesen Wert verwenden, um die Rangfolge der Ergebnisse zu analysieren.

Wenn die Anzahl der Quellblöcke den Wert übersteigt, der in die Antwort passen kann, wird ein Wert im Feld nextToken zurückgegeben. Verwenden Sie diesen Wert in einer anderen Anfrage, um den nächsten Ergebnisstapel zurückzugeben.

Wenn die abgerufenen Daten Bilder enthalten, gibt die Antwort außerdem die folgenden Antwort-Header zurück, die Metadaten für Quellblöcke enthalten, die in der Antwort zurückgegeben wurden:

  • x-amz-bedrock-kb-byte-content-source – Enthält die Amazon-S3-URI des Bildes.

  • x-amz-bedrock-kb-description – Enthält die base64-codierte Zeichenfolge für das Bild.

Anmerkung

Sie können beim Konfigurieren von Metadatenfiltern nicht nach diesen Metadaten-Antwort-Headern filtern.

Multimodale Abfragen

Für Wissensdatenbanken, die multimodale Einbettungsmodelle verwenden, können Sie Abfragen nicht nur mit Text, sondern auch mit Bildern durchführen. Das retrievalQuery Feld unterstützt ein multimodalInputList Feld für Bildabfragen:

Anmerkung

Umfassende Hinweise zur Einrichtung und Nutzung multimodaler Wissensdatenbanken, einschließlich der Wahl zwischen Nova- und BDA-Ansätzen, finden Sie unterAufbau einer Wissensdatenbank für multimodale Inhalte.

{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "text": "Find similar shoes", "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }

Sie können Abfragen auch nur mit Bildern durchführen, indem Sie das Feld weglassen: text

{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }

Allgemeine multimodale Abfragemuster

Image-to-image suchen

Laden Sie ein Bild hoch, um visuell ähnliche Bilder zu finden. Beispiel: Laden Sie ein Foto eines roten Nike-Schuhs hoch, um ähnliche Schuhe in Ihrem Produktkatalog zu finden.

Verfeinerung von Text und Bild

Kombinieren Sie Text und Bilder für genauere Ergebnisse. Beispiel: „Finde ähnliche Schuhe, aber mit unterschiedlichen Farben“ zusammen mit einem hochgeladenen Schuhbild.

Visuelle Dokumentensuche

Suchen Sie nach Diagrammen, Diagrammen oder visuellen Elementen in Dokumenten. Beispiel: Laden Sie ein Diagrammbild hoch, um ähnliche Diagramme in Ihrer Dokumentensammlung zu finden.

Wählen Sie zwischen Nova und BDA für multimodale Inhalte

Wenn Sie mit multimodalen Inhalten arbeiten, wählen Sie Ihren Ansatz auf der Grundlage Ihres Inhaltstyps und Ihrer Abfragemuster:

Entscheidungsmatrix zwischen Nova und BDA
Inhaltstyp Verwenden Sie multimodale Nova-Einbettungen Verwenden Sie den Bedrock Data Automation (BDA) -Parser
Videoinhalte Schwerpunkt visuelles Geschichtenerzählen (Sport, Werbung, Vorführungen), Fragen zu visuellen Elementen, minimaler Sprachinhalt Wichtige Fragen speech/narration (Präsentationen, Besprechungen, Tutorials), Fragen zu gesprochenen Inhalten, benötigen Transkripte
Audioinhalte Identifizierung von Musik oder Soundeffekten, Audioanalyse ohne Sprache Podcasts, Interviews, Besprechungen und alle Inhalte, bei denen Sprache transkribiert werden muss
Inhalt des Bildes Suche nach visueller Ähnlichkeit, image-to-image Abruf, visuelle Inhaltsanalyse Textextraktion aus Bildern, Dokumentenverarbeitung, OCR-Anforderungen
Anmerkung

Multimodale Nova-Einbettungen können Sprachinhalte nicht direkt verarbeiten. Wenn Ihre Audio- oder Videodateien wichtige gesprochene Informationen enthalten, verwenden Sie den BDA-Parser, um Sprache zuerst in Text umzuwandeln, oder wählen Sie stattdessen ein Modell zur Texteinbettung.

Einschränkungen bei multimodalen Abfragen

  • Maximal ein Bild pro Abfrage in der aktuellen Version

  • Bildabfragen werden nur mit multimodalen Einbettungsmodellen (Titan G1 oder Cohere Embed v3) unterstützt

  • RetrieveAndGenerate Die API wird für Wissensdatenbanken mit multimodalen Einbettungsmodellen und S3-Content-Buckets nicht unterstützt

  • Wenn Sie mithilfe von reinen Text-Einbettungsmodellen eine Bildanfrage an eine Wissensdatenbank stellen, wird ein 4xx-Fehler zurückgegeben

Multimodale API-Antwortstruktur

Abrufantworten für multimodale Inhalte enthalten zusätzliche Metadaten:

  • Quell-URI: Verweist auf Ihren ursprünglichen S3-Bucket-Speicherort

  • Zusätzliche URI: Verweist auf die Kopie in Ihrem multimodalen Speicher-Bucket

  • Timestamp-Metadaten: Für Video- und Audio-Chunks enthalten, um eine präzise Positionierung der Wiedergabe zu ermöglichen

Anmerkung

Wenn Sie die API oder das SDK verwenden, müssen Sie den Dateiabruf und die Zeitstempelnavigation in Ihrer Anwendung übernehmen. Die Konsole erledigt dies automatisch mit verbesserter Videowiedergabe und automatischer Zeitstempelnavigation.

Anmerkung

Wenn Sie beim Generieren von Antworten die Fehlermeldung erhalten, dass der Prompt die Zeichenbeschränkung überschreitet, können Sie den Prompt wie folgt kürzen: