Abrufen einer Wissensdatenbank und Datenabruf

Wichtig

Ein Integritätsschutz wird nur auf die Eingabe und die generierte Antwort des LLM angewendet. Er wird nicht auf die Referenzen angewendet, die zur Laufzeit aus Knowledge Bases abgerufen wurden.

Nachdem Ihre Wissensdatenbank eingerichtet ist, können Sie sie abfragen und Blöcke aus Ihren Quelldaten abrufen, die für die Abfrage relevant sind, indem Sie die Retrieve-API-Operation verwenden. Sie können anstelle des standardmäßigen Rankers für Wissensdatenbanken für Amazon Bedrock auch ein Reranker-Modell verwenden, um Quellenblöcke beim Abrufen nach Relevanz zu ordnen.

Überlegungen zur verwalteten Wissensdatenbank

Bei der Abfrage einer verwalteten Wissensdatenbank sind die folgenden Überlegungen zu beachten:

Verwenden Sie managedSearchConfiguration in retrievalConfiguration statt. vectorSearchConfiguration Das vectorSearchConfiguration Feld wird nur für benutzerdefinierte Wissensdatenbanken verwendet.
Beim Abrufen wird immer eine Hybridsuche verwendet, bei der Schlüsselwort- und semantische Suche kombiniert werden. Semantic-only Die Suche ist für vollständig verwaltete Wissensdatenbanken nicht verfügbar.
Das Reranking ist standardmäßig mithilfe eines vom Service verwalteten Reranking-Modells aktiviert. Sie können das Verhalten bei der Neurangierung mit dem folgenden Feld steuern: rerankingModelType managedSearchConfiguration
- MANAGED(Standard) — Ein vom Service verwaltetes Reranking-Modell wird automatisch verwendet. Keine Konfiguration erforderlich.
- CUSTOM— Verwenden Sie Ihr eigenes Bedrock-Renanking-Modell. Sie müssen eine rerankingConfiguration mit dem Modell ARN angeben.
- NONE— Reranking ist deaktiviert.
Verwaltetes Reranking ist nur für Wissensdatenbanken verfügbar, die verwaltete Einbettung verwenden. Wenn Ihre Wissensdatenbank ein benutzerdefiniertes Einbettungsmodell verwendet, können Sie eine benutzerdefinierte Rangfolge verwenden oder die Neueinstufung deaktivieren.
Die Metadatenfilter startsWith und die stringContains Metadatenfilter werden für verwaltete Wissensdatenbanken nicht unterstützt. Details hierzu finden Sie unter Manuelle Metadatenfilterung.

Das folgende Beispiel zeigt eine minimale Retrieve Anforderung für eine vollständig verwaltete Wissensdatenbank mit verwaltetem Reranking (Standard):


{
    "retrievalQuery": {
        "text": "your query text"
    }
}

So deaktivieren Sie das Reranking:


{
    "retrievalQuery": {
        "text": "your query text"
    },
    "retrievalConfiguration": {
        "managedSearchConfiguration": {
            "rerankingModelType": "NONE"
        }
    }
}

Um ein benutzerdefiniertes Bedrock-Renanking-Modell zu verwenden:


{
    "retrievalQuery": {
        "text": "your query text"
    },
    "retrievalConfiguration": {
        "managedSearchConfiguration": {
            "rerankingModelType": "CUSTOM",
            "rerankingConfiguration": {
                "type": "BEDROCK_RERANKING_MODEL",
                "bedrockRerankingConfiguration": {
                    "numberOfRerankedResults": 5,
                    "modelConfiguration": {
                        "modelArn": "arn:aws:bedrock:us-west-2::foundation-model/cohere.rerank-v3-5:0"
                    }
                }
            }
        }
    }
}

Wählen Sie die Registerkarte für Ihre bevorzugte Methode aus und führen Sie dann die Schritte aus, um zu erfahren, wie Sie Ihre Wissensdatenbank abfragen:

Console

Testen Ihrer Wissensdatenbank

Melden Sie sich bei der AWS-Managementkonsole mit einer IAM-Identität an, die berechtigt ist, die Amazon Bedrock-Konsole zu verwenden. Öffnen Sie dann die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock.
Wählen Sie im linken Navigationsbereich Wissensdatenbank aus.
Führen Sie im Abschnitt Wissensdatenbanken eine der folgenden Aktionen aus:
- Aktivieren Sie das Optionsfeld neben der Wissensdatenbank, die Sie testen möchten, und wählen Sie Wissensdatenbank testen. Ein Testfenster wird von rechts erweitert.
- Wählen Sie die Wissensdatenbank aus, die Sie testen möchten. Ein Testfenster wird von rechts erweitert.
Deaktivieren Sie die Option Antworten für Ihre Anfrage generieren im Testfenster, um direkt aus Ihrer Wissensdatenbank abgerufene Informationen zurückzugeben.
(Optional) Klicken Sie auf das Konfigurationssymbol ( ), um Konfigurationen zu öffnen. Weitere Informationen zu Konfigurationen finden Sie unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.
Geben Sie eine Abfrage in das Textfeld im Chatfenster ein und wählen Sie Ausführen aus, um Antworten aus der Wissensdatenbank zurückzugeben.
Die Quell-blöcke werden direkt in der Reihenfolge ihrer Relevanz zurückgegeben. Aus Ihrer Datenquelle extrahierte Bilder können auch als Quellblock zurückgegeben werden.
Klicken Sie auf Quelldetails anzeigen, um Details zu den zurückgegebenen Blöcken anzuzeigen.
- Erweitern Sie den Bereich Abfragekonfigurationen, um die Konfigurationen anzuzeigen, die Sie für die Abfrage festgelegt haben.
- Um Details zu einem Quellblock anzuzeigen, erweitern Sie ihn, indem Sie auf den Rechtspfeil ( ) neben dem Block klicken. Die folgenden Informationen können angezeigt werden:
  - Der Rohtext aus dem Quellblock. Um diesen Text zu kopieren, klicken Sie auf das Kopiersymbol ( ). Wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben, klicken Sie auf das externe Linksymbol ( ), um zu dem S3-Objekt zu navigieren, das die Datei enthält.
  - Die mit dem Quellblock verknüpften Metadaten, wenn Sie Amazon S3 zum Speichern Ihrer Daten verwendet haben. Die attribute/field Schlüssel und Werte sind in der .metadata.json Datei definiert, die dem Quelldokument zugeordnet ist. Weitere Informationen finden Sie im Abschnitt Metadaten und Filterung unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an.

Chat-Optionen

Wechseln Sie zur Generierung von Antworten auf Grundlage der abgerufenen Quellblöcke, indem Sie die Option Antworten generieren aktivieren. Wenn Sie die Einstellung ändern, wird der Text im Chatfenster vollständig gelöscht.
Um das Chat-Fenster zu löschen, wählen Sie das Besensymbol ( ).
Um die gesamte Ausgabe im Chat-Fenster zu kopieren, wählen Sie das Kopiersymbol ( ).

API

Senden Sie eine Retrieve-Anfrage an einen Runtime-Endpunkt für Agenten für Amazon Bedrock, um eine Wissensdatenbank abzufragen und nur relevanten Text aus Datenquellen zurückzugeben.

Die folgenden Felder sind erforderlich:

Feld	Grundlegende Beschreibung
Wissen BaseId	So geben Sie die abzufragende Wissensdatenbank an.
retrievalQuery	Enthält ein `text`-Feld zur Angabe der Abfrage.
guardrailsConfiguration	So fügen Sie guardrailsConfiguration-Felder wie `guardrailsId` und `guardrailsVersion` ein, um Ihren Integritätsschutz in der Anfrage zu verwenden

Die folgenden Felder sind optional:

Feld	Anwendungsfall
nextToken	Um den nächsten Stapel von Antworten zurückzugeben (siehe Antwortfelder unten).
retrievalConfiguration	Um Abfragekonfigurationen für die Anpassung der Vektorsuche einzubeziehen. Weitere Informationen finden Sie unter KnowledgeBaseVectorSearchConfiguration.

Sie können ein Ranking-Modell gegenüber dem standardmäßigen Rankingmodell von Amazon Bedrock Knowledge Bases verwenden, indem Sie das rerankingConfiguration Feld in die aufnehmen. KnowledgeBaseVectorSearchConfiguration Das rerankingConfiguration Feld ist einem VectorSearchRerankingConfigurationObjekt zugeordnet, in dem Sie das zu verwendende Ranking-Modell, alle zusätzlichen einzuschließenden Anforderungsfelder, Metadatenattribute zum Herausfiltern von Dokumenten bei der Neueinstufung und die Anzahl der Ergebnisse angeben können, die nach der Neurangierung zurückgegeben werden sollen. Weitere Informationen finden Sie unter VectorSearchRerankingConfiguration.

Anmerkung

Wenn der von Ihnen angegebene numberOfRerankedResults Wert größer als der numberOfResults Wert in ist, ist die maximale Anzahl von Ergebnissen KnowledgeBaseVectorSearchConfiguration, die zurückgegeben werden, der Wert für. numberOfResults Eine Ausnahme ist, wenn Sie die Zerlegung von Abfragen verwenden (weitere Informationen finden Sie im Abschnitt Abfrageänderungen unter So konfigurieren Sie Abfragen und die Antwortgenerierung und passen diese an. Wenn Sie die Zerlegung von Abfragen verwenden, können die numberOfRerankedResults bis zu fünfmal so hoch wie die numberOfResults sein.

Die Antwort gibt die Quellblöcke aus der Datenquelle als Array von KnowledgeBaseRetrievalResultObjekten im retrievalResults Feld zurück. Jedes KnowledgeBaseRetrievalResultenthält die folgenden Felder:

Feld	Description
Inhalt	Enthält einen Textquellenblock im `text` oder einen Bildquellenblock im `byteContent`-Feld. Wenn es sich bei dem Inhalt um ein Bild handelt, wird die Daten-URI des base64-codierten Inhalts im folgenden Format zurückgegeben: `data:image/jpeg;base64,${base64-encoded string}`.
Metadaten	Enthält jedes Metadatenattribut als Schlüssel und den Metadatenwert als einen JSON-Wert, dem der Schlüssel zugeordnet ist.
location	Enthält den URI oder die URL des Dokuments, zu dem der Quellblock gehört.
score	Der Relevanzwert des Dokuments. Sie können diesen Wert verwenden, um die Rangfolge der Ergebnisse zu analysieren.

Wenn die Anzahl der Quellblöcke den Wert übersteigt, der in die Antwort passen kann, wird ein Wert im Feld nextToken zurückgegeben. Verwenden Sie diesen Wert in einer anderen Anfrage, um den nächsten Ergebnisstapel zurückzugeben.

Wenn die abgerufenen Daten Bilder enthalten, gibt die Antwort außerdem die folgenden Antwort-Header zurück, die Metadaten für Quellblöcke enthalten, die in der Antwort zurückgegeben wurden:

x-amz-bedrock-kb-byte-content-source – Enthält die Amazon-S3-URI des Bildes.
x-amz-bedrock-kb-description – Enthält die base64-codierte Zeichenfolge für das Bild.

Anmerkung

Sie können beim Konfigurieren von Metadatenfiltern nicht nach diesen Metadaten-Antwort-Headern filtern.

Multimodale Abfragen

Für Wissensdatenbanken, die multimodale Einbettungsmodelle verwenden, können Sie Abfragen entweder mit Text oder Bildern durchführen. Das retrievalQuery Feld unterstützt ein multimodalInputList Feld für Bildabfragen:

Anmerkung

Umfassende Hinweise zur Einrichtung und Nutzung multimodaler Wissensdatenbanken, einschließlich der Wahl zwischen Nova- und BDA-Ansätzen, finden Sie unterAufbau einer Wissensdatenbank für multimodale Inhalte.

Sie können Abfragen mit Bildern durchführen, indem Sie das folgende multimodalInputList Feld verwenden:


{
    "knowledgeBaseId": "EXAMPLE123", 
    "retrievalQuery": {
        "multimodalInputList": [
            {
                "content": {
                    "byteContent": "base64-encoded-image-data"
                },
                "modality": "IMAGE"
            }
        ]
    }
}

Oder Sie können nur mit Text abfragen, indem Sie das text Feld verwenden:


{
    "knowledgeBaseId": "EXAMPLE123",
    "retrievalQuery": {
        "text": "Find similar shoes"
    }
}

Allgemeine multimodale Abfragemuster

Im Folgenden sind einige gängige Abfragemuster aufgeführt:

Image-to-image suchen: Laden Sie ein Bild hoch, um visuell ähnliche Bilder zu finden. Beispiel: Laden Sie ein Foto eines roten Nike-Schuhs hoch, um ähnliche Schuhe in Ihrem Produktkatalog zu finden.
Text-based suche: Verwenden Sie Textabfragen, um relevante Inhalte zu finden. Beispiel: „Finden Sie ähnliche Schuhe“, um Ihren Produktkatalog anhand von Textbeschreibungen zu durchsuchen.
Visuelle Dokumentensuche: Suchen Sie nach Diagrammen, Diagrammen oder visuellen Elementen in Dokumenten. Beispiel: Laden Sie ein Diagrammbild hoch, um ähnliche Diagramme in Ihrer Dokumentensammlung zu finden.

Wählen Sie zwischen Nova und BDA für multimodale Inhalte

Wenn Sie mit multimodalen Inhalten arbeiten, wählen Sie Ihren Ansatz auf der Grundlage Ihres Inhaltstyps und Ihrer Abfragemuster:

Entscheidungsmatrix zwischen Nova und BDA
Inhaltstyp	Verwenden Sie multimodale Nova-Einbettungen	Verwenden Sie den Bedrock Data Automation (BDA) -Parser
Videoinhalte	Schwerpunkt visuelles Geschichtenerzählen (Sport, Werbung, Vorführungen), Fragen zu visuellen Elementen, minimaler Sprachinhalt	Wichtige Fragen speech/narration (Präsentationen, Besprechungen, Tutorials), Fragen zu gesprochenen Inhalten, benötigen Transkripte
Audioinhalte	Identifizierung von Musik oder Soundeffekten, Audioanalyse ohne Spracheingabe	Podcasts, Interviews, Besprechungen und alle Inhalte, bei denen Sprache transkribiert werden muss
Inhalt des Bildes	Suche nach visueller Ähnlichkeit, Abruf von Bild zu Bild, visuelle Inhaltsanalyse	Textextraktion aus Bildern, Dokumentenverarbeitung, OCR-Anforderungen

Anmerkung

Multimodale Nova-Einbettungen können Sprachinhalte nicht direkt verarbeiten. Wenn Ihre Audio- oder Videodateien wichtige gesprochene Informationen enthalten, verwenden Sie den BDA-Parser, um Sprache zuerst in Text umzuwandeln, oder wählen Sie stattdessen ein Modell zur Texteinbettung.

Einschränkungen bei multimodalen Abfragen

Im Folgenden sind einige Einschränkungen bei multimodalen Abfragen aufgeführt:

Maximal ein Bild pro Abfrage in der aktuellen Version
Bildabfragen werden nur mit multimodalen Einbettungsmodellen (Titan G1 oder Cohere Embed v3) unterstützt
RetrieveAndGenerate Die API wird für Wissensdatenbanken mit multimodalen Einbettungsmodellen und S3-Content-Buckets nicht unterstützt
Wenn Sie mithilfe von reinen Text-Einbettungsmodellen eine Bildanfrage an eine Wissensdatenbank stellen, wird ein 4xx-Fehler zurückgegeben

Multimodale API-Antwortstruktur

Abrufantworten für multimodale Inhalte enthalten zusätzliche Metadaten:

Quell-URI: Verweist auf Ihren ursprünglichen S3-Bucket-Speicherort
Zusätzliche URI: Verweist auf die Kopie in Ihrem multimodalen Speicher-Bucket
Timestamp-Metadaten: Für Video- und Audio-Chunks enthalten, um eine präzise Positionierung der Wiedergabe zu ermöglichen

Anmerkung

Wenn Sie die API oder das SDK verwenden, müssen Sie den Dateiabruf und die Zeitstempel-Navigation in Ihrer Anwendung übernehmen. Die Konsole erledigt dies automatisch mit verbesserter Videowiedergabe und automatischer Zeitstempelnavigation.

Anmerkung

Wenn Sie beim Generieren von Antworten die Fehlermeldung erhalten, dass der Prompt die Zeichenbeschränkung überschreitet, können Sie den Prompt wie folgt kürzen:

Reduzieren Sie die maximale Anzahl der abgerufenen Ergebnisse (dadurch wird das, was für den Platzhalter $search_results$ in der Vorlagen für Aufforderungen in der Wissensdatenbank: Generierung von Orchestrierung & ausgefüllt wird, gekürzt).
Erstellen Sie die Datenquelle mit einer Chunking-Strategie neu, bei der kleinere Blöcke verwendet werden (dadurch wird das, was für den Platzhalter $search_results$ in der Vorlagen für Aufforderungen in der Wissensdatenbank: Generierung von Orchestrierung & ausgefüllt wird, gekürzt).
Kürzen Sie die Vorlage für den Prompt.
Kürzen Sie die Benutzerabfrage (dadurch wird das, was für den Platzhalter $query$ in der Vorlagen für Aufforderungen in der Wissensdatenbank: Generierung von Orchestrierung & ausgefüllt wird, gekürzt).

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Testen Ihrer Wissensdatenbank mit Abfragen und Antworten

Testen Sie Ihre vom Kunden verwaltete Wissensdatenbank