Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
So fragen Sie eine Wissensdatenbank ab und generieren Antworten auf Grundlage der abgerufenen Daten
Wichtig
Ein Integritätsschutz wird nur auf die Eingabe und die generierte Antwort des LLM angewendet. Er wird nicht auf die Referenzen angewendet, die zur Laufzeit aus Knowledge Bases abgerufen wurden.
Nachdem Ihre Wissensdatenbank eingerichtet ist, können Sie sie abfragen und Antworten basierend auf den aus Ihren Quelldaten abgerufenen Blöcken generieren, indem Sie die RetrieveAndGenerate-API-Operation verwenden. Die Antworten werden mit Zitate der ursprünglichen Quelldaten zurückgegeben. Sie können anstelle des standardmäßigen Rankers für Wissensdatenbanken für Amazon Bedrock auch ein Reranker-Modell verwenden, um Quellenblöcke beim Abrufen nach Relevanz zu ordnen.
Einschränkungen multimodaler Inhalte
RetrieveAndGeneratebietet begrenzte Unterstützung für multimodale Inhalte. Bei der Verwendung von Nova Multimodal Embeddings ist die RAG-Funktionalität nur auf Textinhalte beschränkt. Verwenden Sie BDA mit Modellen zur Texteinbettung, um eine vollständige multimodale Unterstützung einschließlich Audio- und Videoverarbeitung zu erhalten. Details hierzu finden Sie unter Aufbau einer Wissensdatenbank für multimodale Inhalte.
Anmerkung
Bilder, die von der Retrieve-Antwort während des RetrieveAndGenerate-Flows zurückgegeben werden, sind im Prompt für die Antwortgenerierung enthalten. Die RetrieveAndGenerate-Antwort kann keine Bilder enthalten, aber sie kann die Quellen angeben, die die Bilder enthalten.
Wählen Sie die Registerkarte für Ihre bevorzugte Methode aus und führen Sie dann die Schritte aus, um zu erfahren, wie Sie Ihre Wissensdatenbank abfragen:
Anmerkung
Wenn Sie beim Generieren von Antworten die Fehlermeldung erhalten, dass der Prompt die Zeichenbeschränkung überschreitet, können Sie den Prompt wie folgt kürzen:
-
Reduzieren Sie die maximale Anzahl der abgerufenen Ergebnisse (dadurch wird das, was für den Platzhalter $search_results$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).
-
Erstellen Sie die Datenquelle mit einer Chunking-Strategie neu, bei der kleinere Blöcke verwendet werden (dadurch wird das, was für den Platzhalter $search_results$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).
-
Kürzen Sie die Vorlage für den Prompt.
-
Kürzen Sie die Benutzerabfrage (dadurch wird das, was für den Platzhalter $query$ in der Vorlagen für Wissensdatenbank-Prompts: Orchestrierung und Generierung ausgefüllt wird, gekürzt).