Verwenden von S3-Vektoren mit Amazon Bedrock Knowledge Bases - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von S3-Vektoren mit Amazon Bedrock Knowledge Bases

Anmerkung

Amazon S3 Vectors befindet sich in der Vorschauversion für Amazon Simple Storage Service und kann sich ändern.

S3 Vectors lässt sich in Amazon Bedrock Knowledge Bases und Amazon SageMaker AI Unified Studio integrieren, um die Vektorspeicherung für Retrieval Augmented Generation (RAG) -Anwendungen zu vereinfachen und die Kosten zu senken.

Weitere Informationen zu CLI-Befehlen auf hoher Ebene, die Amazon Bedrock-Einbettungsmodelle in S3 Vectors-Operationen integrieren, finden Sie unter.

Überblick über die Integration

Wenn Sie eine Wissensdatenbank in Amazon Bedrock erstellen, können Sie S3 Vectors als Ihren Vektorspeicher auswählen. Diese Integration bietet Folgendes:

  • Kosteneinsparungen für RAG-Anwendungen mit großen Vektordatensätzen.

  • Nahtlose Integration mit dem vollständig verwalteten RAG-Workflow von Amazon Bedrock.

  • Automatisches Vektormanagement, das vom Amazon Bedrock-Service abgewickelt wird.

  • Abfragelatenz von weniger als einer Sekunde für Operationen zum Abrufen von Wissensdatenbanken.

Amazon Bedrock Knowledge Bases bietet einen vollständig verwalteten end-to-end RAG-Workflow. Wenn Sie mit S3 Vectors eine Wissensdatenbank erstellen, ruft Amazon Bedrock automatisch Daten aus Ihrer S3-Datenquelle ab, konvertiert Inhalte in Textblöcke, generiert Einbettungen und speichert sie in Ihrem Vektorindex. Anschließend können Sie die Wissensdatenbank abfragen und Antworten auf der Grundlage von Blöcken generieren, die aus Ihren Quelldaten abgerufen wurden.

Wann sollte diese Integration verwendet werden

Erwägen Sie die Verwendung von S3 Vectors mit Amazon Bedrock Knowledge Bases, wenn Sie Folgendes benötigen:

  • Kostengünstiger Vektorspeicher für große Datensätze, bei denen die Abfragelatenz von weniger als einer Sekunde Ihren Anwendungsanforderungen entspricht.

  • Text- und bildgestützter Abruf von Dokumenten für Anwendungsfälle wie das Durchsuchen von Handbüchern, Richtlinien und visuellen Inhalten.

  • RAG-Anwendungen, die der Optimierung der Speicherkosten Vorrang vor Reaktionen mit extrem niedriger Latenz einräumen.

  • Verwaltete Vektoroperationen, ohne dass Sie die API-Operationen von S3 Vectors direkt erlernen müssen — Sie können weiterhin die vertrauten Amazon Bedrock-Benutzeroberflächen verwenden.

  • Langfristiger Vektorspeicher mit der Haltbarkeit und Skalierbarkeit von Amazon S3

Diese Integration ist ideal für Unternehmen, die RAG-Anwendungen entwickeln, die geschriebene Inhalte und Bilder durchsuchen und Erkenntnisse daraus gewinnen müssen, wobei die Kostenvorteile von S3 Vectors mit akzeptablen Anforderungen an die Abfrageleistung übereinstimmen müssen.

Unterstützte Einbettungsmodelle

Die S3 Vectors-Integration mit Amazon Bedrock Knowledge Bases unterstützt die folgenden Einbettungsmodelle:

  • Amazon. titan-embed-text-v2:0 - Für textbasierte Einbettungen

  • Amazon. titan-embed-image-v1 - Für Bild- und multimodale Einbettungen

  • kohärent. embed-english-v3 - Für mehrsprachige und spezialisierte Texteinbettungen

Voraussetzungen und Berechtigungen

Bevor Sie eine Wissensdatenbank mit S3 Vectors erstellen, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Entsprechende IAM-Berechtigungen für S3 Vectors und Amazon Bedrock Services. Weitere Informationen zu IAM-Berechtigungen für S3 Vectors finden Sie unter. Identitäts- und Zugriffsmanagement in S3 Vectors Weitere Informationen zu IAM-Berechtigungen für Ihre Amazon Bedrock Knowledge Bases-Servicerolle für den Zugriff auf S3 Vectors finden Sie unter Zugriffsberechtigungen für Ihren Vector Store in Amazon S3 Vectors im Amazon Bedrock-Benutzerhandbuch.

  • Ihre Quelldokumente wurden für die Aufnahme in die Wissensdatenbank vorbereitet.

  • Ein Verständnis Ihrer Anforderungen an das Einbettungsmodell.

Bei der Einrichtung von Sicherheitskonfigurationen können Sie eine IAM-Rolle wählen, die Amazon Bedrock die Berechtigung zum Zugriff auf die erforderlichen AWS Dienste gewährt. Sie können Amazon Bedrock die Servicerolle erstellen lassen oder Ihre eigene benutzerdefinierte Rolle verwenden. Wenn Sie eine benutzerdefinierte Rolle verwenden, konfigurieren Sie eine Vektor-Bucket-Richtlinie, die den Zugriff auf den Vektor-Bucket und den Vektorindex auf die benutzerdefinierte Rolle beschränkt.

Ausführliche Informationen zu den erforderlichen Berechtigungen und IAM-Rollen finden Sie unter Erstellen einer Servicerolle für Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch. Die Servicerolle muss außerdem über Berechtigungen für S3-Vektoren und AWS KMS API-Operationen verfügen.

Erstellen einer Wissensdatenbank mit S3 Vectors

Sie können eine Wissensdatenbank, die S3-Vektoren verwendet, auf zwei Arten erstellen.

Methode eins: Verwenden der Amazon Bedrock-Konsole

Wenn Sie eine Wissensdatenbank in der Amazon Bedrock-Konsole erstellen, können Sie „S3 Vector Bucket“ als Ihre Vector Store-Option wählen. Sie haben zwei Einrichtungsoptionen:

Eine ausführliche step-by-step Anleitung finden Sie unter Erstellen einer Wissensdatenbank durch Herstellen einer Verbindung zu einer Datenquelle in Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch.

Methode zwei: Verwenden von Amazon SageMaker Unified Studio

Sie können Wissensdatenbanken auch mit S3 Vectors über Amazon Bedrock in Amazon SageMaker AI Unified Studio erstellen und verwalten. Dies bietet eine einheitliche Entwicklungsumgebung zum Erstellen und Testen von KI-Anwendungen, die Wissensdatenbanken verwenden.

Amazon Bedrock in SageMaker AI Unified Studio wurde für Benutzer entwickelt, die integrierte Notebook-Funktionen benötigen und mit mehreren AWS ML- und Analysediensten arbeiten. Sie können schnell einen S3-Vektor-Bucket erstellen und ihn als Vektorspeicher für Ihre Wissensdatenbanken konfigurieren, wenn Sie generative KI-Anwendungen erstellen.

Informationen zur Verwendung von S3 Vectors mit Amazon Bedrock in SageMaker AI Unified Studio finden Sie unter Hinzufügen einer Datenquelle zu Ihrer Amazon Bedrock-App im SageMaker AI Unified Studio-Benutzerhandbuch.

Verwaltung und Abfrage Ihrer Wissensdatenbank

Datensynchronisierung und -verwaltung

Amazon Bedrock Knowledge Bases bietet Ingestion-Job-Operationen, um Ihre Datenquellen- und Vektoreinbettungen synchron zu halten. Wenn Sie Ihre Datenquelle synchronisieren, scannt Amazon Bedrock jedes Dokument und überprüft, ob es im Vector Store indexiert wurde. Mit diesem Vorgang können Sie Dokumente auch direkt in den Vektorspeicher indizieren. IngestKnowledgeBaseDocuments Es hat sich bewährt, für jede Wissensdatenbank einen eigenen Vektorspeicher zu erstellen, um die Datensynchronisierung sicherzustellen.

Wenn Sie eine Wissensdatenbank- oder Datenquellenressource löschen, bietet Amazon Bedrock zwei Richtlinien zum Löschen von Daten: Delete (Standard) undRetain. Wenn Sie sich Delete für die Richtlinie entscheiden, werden Vektoren im Vektorindex und im Vektor-Bucket automatisch gelöscht.

Abfragen und Abrufen

Nachdem Ihre Wissensdatenbank eingerichtet ist, können Sie wie folgt vorgehen:

  • Rufen Sie mithilfe der Operation „API abrufen“ Abschnitte aus Ihren Quelldaten ab.

  • Generieren Sie mithilfe der API-Operation Antworten auf der Grundlage der abgerufenen Chunks. RetrieveAndGenerate

  • Testen Sie Abfragen direkt in der Amazon Bedrock-Konsole.

Antworten werden mit Zitaten auf die ursprünglichen Quelldaten zurückgegeben.

Einschränkungen

Wenn Sie S3 Vectors mit Amazon Bedrock Knowledge Bases verwenden, sollten Sie die folgenden Einschränkungen kennen:

  • Nur semantische Suche: S3 Vectors unterstützt die semantische Suche, jedoch keine hybriden Suchfunktionen.

  • Größenbeschränkungen für S3-Vektoren: Jeder Vektor hat eine Gesamtgrößenbeschränkung für Metadaten und eine Größenbeschränkung für filterbare Metadaten, wodurch benutzerdefinierte Metadaten und Filteroptionen eingeschränkt werden können. Weitere Informationen zu Metadaten und Größenbeschränkungen für filterbare Metadaten pro Vektor finden Sie unter. Begrenzungen und Einschränkungen

  • Einschränkungen bei der Chunking-Strategie: Aufgrund von Größenbeschränkungen für Metadaten auf Modelle beschränkt, die Inhalte in Blöcke von bis zu 500 Token aufteilen.

  • Nur Gleitkomma-Vektoren: Binäre Vektor-Einbettungen werden nicht unterstützt.

Umfassende Anleitungen zur Arbeit mit Amazon Bedrock Knowledge Bases finden Sie unter Daten abrufen und KI-Antworten mit Amazon Bedrock Knowledge Bases generieren im Amazon Bedrock User Guide.