Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Abrufen einer Wissensdatenbank und Datenabruf
Wichtig
Ein Integritätsschutz wird nur auf die Eingabe und die generierte Antwort des LLM angewendet. Er wird nicht auf die Referenzen angewendet, die zur Laufzeit aus Knowledge Bases abgerufen wurden.
Nachdem Ihre Wissensdatenbank eingerichtet ist, können Sie sie abfragen und Blöcke aus Ihren Quelldaten abrufen, die für die Abfrage relevant sind, indem Sie die Retrieve-API-Operation verwenden. Sie können anstelle des standardmäßigen Rankers für Wissensdatenbanken für Amazon Bedrock auch ein Reranker-Modell verwenden, um Quellenblöcke beim Abrufen nach Relevanz zu ordnen.
Wählen Sie die Registerkarte für Ihre bevorzugte Methode aus und führen Sie dann die Schritte aus, um zu erfahren, wie Sie Ihre Wissensdatenbank abfragen:
- Console
-
Testen Ihrer Wissensdatenbank
-
Melden Sie sich bei der AWS-Managementkonsole mit einer IAM-Identität an, die berechtigt ist, die Amazon Bedrock-Konsole zu verwenden. Öffnen Sie dann die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock
. -
Wählen Sie im linken Navigationsbereich Wissensdatenbank aus.
-
Führen Sie im Abschnitt Wissensdatenbanken eine der folgenden Aktionen aus:
-
Aktivieren Sie das Optionsfeld neben der Wissensdatenbank, die Sie testen möchten, und wählen Sie Wissensdatenbank testen. Ein Testfenster wird von rechts erweitert.
-
Wählen Sie die Wissensdatenbank aus, die Sie testen möchten. Ein Testfenster wird von rechts erweitert.
-
-
Deaktivieren Sie die Option Antworten für Ihre Anfrage generieren im Testfenster, um direkt aus Ihrer Wissensdatenbank abgerufene Informationen zurückzugeben.
-
(Optional) Klicken Sie auf das Konfigurationssymbol (
), um Konfigurationen zu öffnen. Weitere Informationen zu Konfigurationen finden Sie unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an. -
Geben Sie eine Abfrage in das Textfeld im Chatfenster ein und wählen Sie Ausführen aus, um Antworten aus der Wissensdatenbank zurückzugeben.
-
Die Quell-blöcke werden direkt in der Reihenfolge ihrer Relevanz zurückgegeben. Aus Ihrer Datenquelle extrahierte Bilder können auch als Quellblock zurückgegeben werden.
-
Klicken Sie auf Quelldetails anzeigen, um Details zu den zurückgegebenen Blöcken anzuzeigen.
-
Erweitern Sie den Bereich Abfragekonfigurationen, um die Konfigurationen anzuzeigen, die Sie für die Abfrage festgelegt haben.
-
Um Details zu einem Quellblock anzuzeigen, erweitern Sie ihn, indem Sie auf den Rechtspfeil (
) neben dem Block klicken. Die folgenden Informationen können angezeigt werden:-
Der Rohtext aus dem Quellblock. Um diesen Text zu kopieren, klicken Sie auf das Kopiersymbol (
). Wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben, klicken Sie auf das externe Linksymbol (
), um zu dem S3-Objekt zu navigieren, das die Datei enthält. -
Die mit dem Quellblock verknüpften Metadaten, wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben. Die attribute/field Schlüssel und Werte sind in der
.metadata.jsonDatei definiert, die dem Quelldokument zugeordnet ist. Weitere Informationen finden Sie im Abschnitt Metadaten und Filterung unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.
-
-
Chat-Optionen
-
Wechseln Sie zur Generierung von Antworten auf Grundlage der abgerufenen Quellblöcke, indem Sie die Option Antworten generieren aktivieren. Wenn Sie die Einstellung ändern, wird der Text im Chatfenster vollständig gelöscht.
-
Um das Chat-Fenster zu löschen, wählen Sie das Besensymbol (
). -
Um die gesamte Ausgabe im Chat-Fenster zu kopieren, wählen Sie das Kopiersymbol (
).
-
- API
-
Senden Sie eine Retrieve-Anfrage an einen Runtime-Endpunkt für Agenten für Amazon Bedrock, um eine Wissensdatenbank abzufragen und nur relevanten Text aus Datenquellen zurückzugeben.
Die folgenden Felder sind erforderlich:
Feld Grundlegende Beschreibung knowledgeBaseId So geben Sie die abzufragende Wissensdatenbank an. retrievalQuery Enthält ein text-Feld zur Angabe der Abfrage.guardrailsConfiguration So fügen Sie guardrailsConfiguration-Felder wie guardrailsIdundguardrailsVersionein, um Ihren Integritätsschutz in der Anfrage zu verwendenDie folgenden Felder sind optional:
Feld Anwendungsfall nextToken Um den nächsten Stapel von Antworten zurückzugeben (siehe Antwortfelder unten). retrievalConfiguration Um Abfragekonfigurationen für die Anpassung der Vektorsuche einzubeziehen. Weitere Informationen finden Sie unter KnowledgeBaseVectorSearchConfiguration. Sie können ein Ranking-Modell gegenüber dem standardmäßigen Rankingmodell von Amazon Bedrock Knowledge Bases verwenden, indem Sie das
rerankingConfigurationFeld in die aufnehmen. KnowledgeBaseVectorSearchConfiguration DasrerankingConfigurationFeld ist einem VectorSearchRerankingConfigurationObjekt zugeordnet, in dem Sie das zu verwendende Ranking-Modell, alle zusätzlichen einzuschließenden Anforderungsfelder, Metadatenattribute zum Herausfiltern von Dokumenten bei der Neueinstufung und die Anzahl der Ergebnisse angeben können, die nach der Neurangierung zurückgegeben werden sollen. Weitere Informationen finden Sie unter VectorSearchRerankingConfiguration.Anmerkung
Wenn der von Ihnen angegebene
numberOfRerankedResultsWert größer als dernumberOfResultsWert in ist, ist die maximale Anzahl von Ergebnissen KnowledgeBaseVectorSearchConfiguration, die zurückgegeben werden, der Wert für.numberOfResultsEine Ausnahme ist, wenn Sie die Zerlegung von Abfragen verwenden (weitere Informationen finden Sie im Abschnitt Abfrageänderungen unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an. Wenn Sie die Zerlegung von Abfragen verwenden, können dienumberOfRerankedResultsbis zu fünfmal so hoch wie dienumberOfResultssein.Die Antwort gibt die Quellblöcke aus der Datenquelle als Array von KnowledgeBaseRetrievalResultObjekten im
retrievalResultsFeld zurück. Jedes KnowledgeBaseRetrievalResultenthält die folgenden Felder:Feld Description Inhalt Enthält einen Textquellenblock im textoder einen Bildquellenblock imbyteContent-Feld. Wenn es sich bei dem Inhalt um ein Bild handelt, wird die Daten-URI des base64-codierten Inhalts im folgenden Format zurückgegeben:data:image/jpeg;base64,.${base64-encoded string}Metadaten Enthält jedes Metadatenattribut als Schlüssel und den Metadatenwert als einen JSON-Wert, dem der Schlüssel zugeordnet ist. location Enthält den URI oder die URL des Dokuments, zu dem der Quellblock gehört. score Der Relevanzwert des Dokuments. Sie können diesen Wert verwenden, um die Rangfolge der Ergebnisse zu analysieren. Wenn die Anzahl der Quellblöcke den Wert übersteigt, der in die Antwort passen kann, wird ein Wert im Feld
nextTokenzurückgegeben. Verwenden Sie diesen Wert in einer anderen Anfrage, um den nächsten Ergebnisstapel zurückzugeben.Wenn die abgerufenen Daten Bilder enthalten, gibt die Antwort außerdem die folgenden Antwort-Header zurück, die Metadaten für Quellblöcke enthalten, die in der Antwort zurückgegeben wurden:
-
x-amz-bedrock-kb-byte-content-source– Enthält die Amazon-S3-URI des Bildes. -
x-amz-bedrock-kb-description– Enthält die base64-codierte Zeichenfolge für das Bild.
Anmerkung
Sie können beim Konfigurieren von Metadatenfiltern nicht nach diesen Metadaten-Antwort-Headern filtern.
Multimodale Abfragen
Für Wissensdatenbanken, die multimodale Einbettungsmodelle verwenden, können Sie Abfragen nicht nur mit Text, sondern auch mit Bildern durchführen. Das
retrievalQueryFeld unterstützt einmultimodalInputListFeld für Bildabfragen:Anmerkung
Umfassende Hinweise zur Einrichtung und Nutzung multimodaler Wissensdatenbanken, einschließlich der Wahl zwischen Nova- und BDA-Ansätzen, finden Sie unterAufbau einer Wissensdatenbank für multimodale Inhalte.
{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "text": "Find similar shoes", "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }Sie können Abfragen auch nur mit Bildern durchführen, indem Sie das Feld weglassen:
text{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }Allgemeine multimodale Abfragemuster
- Image-to-image suchen
-
Laden Sie ein Bild hoch, um visuell ähnliche Bilder zu finden. Beispiel: Laden Sie ein Foto eines roten Nike-Schuhs hoch, um ähnliche Schuhe in Ihrem Produktkatalog zu finden.
- Verfeinerung von Text und Bild
-
Kombinieren Sie Text und Bilder für genauere Ergebnisse. Beispiel: „Finde ähnliche Schuhe, aber mit unterschiedlichen Farben“ zusammen mit einem hochgeladenen Schuhbild.
- Visuelle Dokumentensuche
-
Suchen Sie nach Diagrammen, Diagrammen oder visuellen Elementen in Dokumenten. Beispiel: Laden Sie ein Diagrammbild hoch, um ähnliche Diagramme in Ihrer Dokumentensammlung zu finden.
Wählen Sie zwischen Nova und BDA für multimodale Inhalte
Wenn Sie mit multimodalen Inhalten arbeiten, wählen Sie Ihren Ansatz auf der Grundlage Ihres Inhaltstyps und Ihrer Abfragemuster:
Entscheidungsmatrix zwischen Nova und BDA Inhaltstyp Verwenden Sie multimodale Nova-Einbettungen Verwenden Sie den Bedrock Data Automation (BDA) -Parser Videoinhalte Schwerpunkt visuelles Geschichtenerzählen (Sport, Werbung, Vorführungen), Fragen zu visuellen Elementen, minimaler Sprachinhalt Wichtige Fragen speech/narration (Präsentationen, Besprechungen, Tutorials), Fragen zu gesprochenen Inhalten, benötigen Transkripte Audioinhalte Identifizierung von Musik oder Soundeffekten, Audioanalyse ohne Sprache Podcasts, Interviews, Besprechungen und alle Inhalte, bei denen Sprache transkribiert werden muss Inhalt des Bildes Suche nach visueller Ähnlichkeit, image-to-image Abruf, visuelle Inhaltsanalyse Textextraktion aus Bildern, Dokumentenverarbeitung, OCR-Anforderungen Anmerkung
Multimodale Nova-Einbettungen können Sprachinhalte nicht direkt verarbeiten. Wenn Ihre Audio- oder Videodateien wichtige gesprochene Informationen enthalten, verwenden Sie den BDA-Parser, um Sprache zuerst in Text umzuwandeln, oder wählen Sie stattdessen ein Modell zur Texteinbettung.
Einschränkungen bei multimodalen Abfragen
-
Maximal ein Bild pro Abfrage in der aktuellen Version
-
Bildabfragen werden nur mit multimodalen Einbettungsmodellen (Titan G1 oder Cohere Embed v3) unterstützt
-
RetrieveAndGenerate Die API wird für Wissensdatenbanken mit multimodalen Einbettungsmodellen und S3-Content-Buckets nicht unterstützt
-
Wenn Sie mithilfe von reinen Text-Einbettungsmodellen eine Bildanfrage an eine Wissensdatenbank stellen, wird ein 4xx-Fehler zurückgegeben
Multimodale API-Antwortstruktur
Abrufantworten für multimodale Inhalte enthalten zusätzliche Metadaten:
-
Quell-URI: Verweist auf Ihren ursprünglichen S3-Bucket-Speicherort
-
Zusätzliche URI: Verweist auf die Kopie in Ihrem multimodalen Speicher-Bucket
-
Timestamp-Metadaten: Für Video- und Audio-Chunks enthalten, um eine präzise Positionierung der Wiedergabe zu ermöglichen
Anmerkung
Wenn Sie die API oder das SDK verwenden, müssen Sie den Dateiabruf und die Zeitstempelnavigation in Ihrer Anwendung übernehmen. Die Konsole erledigt dies automatisch mit verbesserter Videowiedergabe und automatischer Zeitstempelnavigation.
-
Anmerkung
Wenn Sie beim Generieren von Antworten die Fehlermeldung erhalten, dass der Prompt die Zeichenbeschränkung überschreitet, können Sie den Prompt wie folgt kürzen:
-
Reduzieren Sie die maximale Anzahl der abgerufenen Ergebnisse (dadurch wird das, was für den Platzhalter $search_results$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).
-
Erstellen Sie die Datenquelle mit einer Chunking-Strategie neu, bei der kleinere Blöcke verwendet werden (dadurch wird das, was für den Platzhalter $search_results$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).
-
Kürzen Sie die Vorlage für den Prompt.
-
Kürzen Sie die Benutzerabfrage (dadurch wird das, was für den Platzhalter $query$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).