Verwenden von S3-Vektoren mit Amazon Bedrock Knowledge Bases
Anmerkung
Amazon S3 Vectors befindet sich in der Vorabversion für Amazon Simple Storage Service und unterliegt noch Änderungen.
S3 Vectors lässt sich in Amazon Bedrock Knowledge Bases
Weitere Informationen zu CLI-Befehlen auf hoher Ebene, die Amazon Bedrock-Einbettungsmodelle in S3 Vectors-Operationen integrieren, finden Sie unter.
Themen
Übersicht über die Integration
Wenn Sie eine Wissensdatenbank in Amazon Bedrock erstellen, können Sie S3 Vectors als Ihren Vektorspeicher auswählen. Diese Integration bietet Folgendes:
-
Kosteneinsparungen für RAG-Anwendungen mit großen Vektordatensätzen.
-
Nahtlose Integration mit dem vollständig verwalteten RAG-Workflow von Amazon Bedrock.
-
Automatisches Vektormanagement, das vom Amazon Bedrock-Service abgewickelt wird.
-
Abfragelatenz von weniger als einer Sekunde beim Abrufen von Wissensdatenbanken.
Amazon Bedrock Knowledge Bases bietet einen vollständig verwalteten, durchgängigen RAG-Workflow. Wenn Sie mit S3 Vectors eine Wissensdatenbank erstellen, ruft Amazon Bedrock automatisch Daten aus Ihrer S3-Datenquelle ab, konvertiert Inhalte in Textblöcke, generiert Einbettungen und speichert sie in Ihrem Vektorindex. Anschließend können Sie die Wissensdatenbank abfragen und Antworten auf der Grundlage von Blöcken generieren, die aus Ihren Quelldaten abgerufen wurden.
Wann sollte diese Integration verwendet werden
Erwägen Sie die Verwendung von S3 Vectors mit Amazon Bedrock Knowledge Bases, wenn Sie Folgendes benötigen:
-
Kostengünstiger Vektorspeicher für große Datensätze, bei denen die Abfragelatenz von weniger als einer Sekunde Ihren Anwendungsanforderungen entspricht.
-
Text- und bildgestützter Abruf von Dokumenten für Anwendungsfälle wie das Durchsuchen von Handbüchern, Richtlinien und visuellen Inhalten.
-
RAG-Anwendungen, die der Optimierung der Speicherkosten Vorrang vor Reaktionen mit extrem niedriger Latenz einräumen.
-
Verwaltete Vektoroperationen, ohne sich direkt mit den Operationen der S3-Vektoren-API vertraut machen zu müssen – Sie können weiterhin die vertrauten Amazon Bedrock-Schnittstellen verwenden.
-
Langfristiger Vektorspeicher mit der Haltbarkeit und Skalierbarkeit von Amazon S3
Diese Integration ist ideal für Unternehmen, die RAG-Anwendungen entwickeln, die geschriebene Inhalte und Bilder durchsuchen und Erkenntnisse daraus gewinnen müssen, wobei die Kostenvorteile von S3 Vectors mit akzeptablen Anforderungen an die Abfrageleistung übereinstimmen müssen.
Unterstützte Einbettungsmodelle
Die S3 Vectors-Integration mit Amazon Bedrock Knowledge Bases unterstützt die folgenden Einbettungsmodelle:
-
amazon.titan-embed-text-v2:0 – Für textbasierte Einbettungen
-
amazon.titan-embed-image-v1 – Für Bild- und multimodale Einbettungen
-
cohere.embed-english-v3 – Für mehrsprachige und spezialisierte Text-Einbettungen
Voraussetzungen und Berechtigungen
Bevor Sie eine Wissensdatenbank mit S3 Vectors erstellen, stellen Sie sicher, dass Sie über Folgendes verfügen:
-
Entsprechende IAM-Berechtigungen für S3 Vectors und Amazon Bedrock Services. Weitere Informationen zu IAM-Berechtigungen für S3 Vectors finden Sie unter Identity and Access Management in Amazon S3 Vectors. Weitere Informationen zu IAM-Berechtigungen für Ihre Amazon Bedrock Knowledge Bases-Servicerolle für den Zugriff auf S3 Vectors finden Sie unter Zugriffsberechtigungen für Ihren Vector Store in Amazon S3 Vectors im Amazon Bedrock-Benutzerhandbuch.
-
Ihre Quelldokumente sind für die Aufnahme in die Wissensdatenbank vorbereitet.
-
Ein Verständnis Ihrer Anforderungen an das Einbettungsmodell.
Bei der Einrichtung von Sicherheitskonfigurationen können Sie eine IAM-Rolle wählen, die Amazon Bedrock die Berechtigung zum Zugriff auf die erforderlichen AWS Services gewährt. Sie können die Servicerolle von Amazon Bedrock erstellen lassen oder Ihre eigene benutzerdefinierte Rolle verwenden. Wenn Sie eine benutzerdefinierte Rolle verwenden, konfigurieren Sie eine Vektor-Bucket-Richtlinie, die den Zugriff auf den Vektor-Bucket und den Vektorindex auf die benutzerdefinierte Rolle beschränkt.
Ausführliche Informationen zu den erforderlichen Berechtigungen und IAM-Rollen finden Sie unter Erstellen einer Servicerolle für Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch. Die Servicerolle muss außerdem über Berechtigungen für S3-Vektoren und AWS KMS API-Operationen verfügen.
Erstellen einer Wissensdatenbank mit S3 Vectors
Sie können eine Wissensdatenbank, die S3-Vektoren verwendet, auf zwei Arten erstellen.
Methode 1: Verwendung der Amazon Bedrock-Konsole
Wenn Sie eine Wissensdatenbank in der Amazon Bedrock-Konsole erstellen, können Sie „S3-Vektor-Bucket“ als Ihre Option für den Vektorspeicher auswählen. Sie haben zwei Einrichtungsoptionen:
-
Einen neuen Vektorspeicher schnell erstellen – Amazon Bedrock erstellt einen S3-Vektor-Bucket und einen Vektorindex und konfiguriert diese mit den erforderlichen Einstellungen für Sie. Standardmäßig wird der Vektor-Bucket mithilfe der serverseitigen Verschlüsselung (SSE) mit von Amazon S3 verwalteten Schlüsseln (SSE-S3) verschlüsselt. Sie können den Bucket optional mit verschlüsseln. AWS KMS Weitere Informationen zur Schnellerstellung eines neuen Vektorspeichers in der Konsole finden Sie unter Erstellen einer Wissensdatenbank durch Herstellen einer Verbindung zu einer Datenquelle in Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch.
-
Einen selbst erstellten Vektorspeicher auswählen – Wählen Sie einen vorhandenen S3-Vektor-Bucket und einen Vektorindex aus Ihrem Konto aus, die Sie zuvor erstellt haben. Weitere Informationen zur Erstellung eines S3-Vektor-Buckets und eines Vektorindexes in der Amazon Bedrock Knowledge Bases-Konsole finden Sie auf der Registerkarte S3-Vektoren unter Voraussetzungen für die Verwendung eines Vektorspeichers, den Sie für eine Wissensdatenbank erstellt haben, im Amazon Bedrock-Benutzerhandbuch.
Eine ausführliche schrittweise Anleitung finden Sie unter Erstellen einer Wissensdatenbank durch Herstellen einer Verbindung zu einer Datenquelle in Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch.
Methode zwei: Verwenden von Amazon SageMaker Unified Studio
Sie können Wissensdatenbanken auch mit S3 Vectors über Amazon Bedrock in Amazon SageMaker AI
Amazon Bedrock in SageMaker AI Unified Studio
Informationen zur Verwendung von S3 Vectors mit Amazon Bedrock in SageMaker AI Unified Studio finden Sie unter Hinzufügen einer Datenquelle zu Ihrer Amazon Bedrock-Anwendung im SageMaker AI Unified Studio-Benutzerhandbuch.
Verwaltung Ihrer Wissensdatenbank und Abfrage Ihrer Wissensdatenbank
Datensynchronisierung und -verwaltung
Amazon Bedrock Knowledge Bases bietet Ingestion-Job-Operationen, um Ihre Datenquellen- und Vektoreinbettungen synchron zu halten. Wenn Sie Ihre Datenquelle synchronisieren, scannt Amazon Bedrock jedes Dokument und überprüft, ob es im Vector Store indexiert wurde. Sie können Dokumente auch direkt mit der Operation IngestKnowledgeBaseDocuments in den Vektorspeicher indizieren. Es hat sich bewährt, für jede Wissensdatenbank einen eigenen Vektorspeicher zu erstellen, um die Datensynchronisierung sicherzustellen.
Wenn Sie eine Wissensdatenbank oder Datenquelle löschen, bietet Amazon Bedrock zwei Richtlinien zum Löschen von Daten an: Delete (Standard) und Retain. Wenn Sie die Richtlinie Delete auswählen, werden Vektoren im Vektorindex und im Vektor-Bucket automatisch gelöscht.
Abfragen und Abrufen
Nachdem Ihre Wissensdatenbank eingerichtet ist, haben Sie folgende Optionen:
-
Rufen Sie mithilfe der Operation API abrufen-Abschnitte aus Ihren Quelldaten ab.
-
Generieren Sie mithilfe des API-Vorgangs RetrieveAndGenerate Antworten auf der Grundlage der abgerufenen Chunks.
-
Testen Sie Abfragen direkt in der Amazon Bedrock-Konsole.
Die Antworten werden mit Verweisen auf die ursprünglichen Quelldaten zurückgesendet.
Einschränkungen
Wenn Sie S3 Vectors mit Amazon Bedrock Knowledge Bases verwenden, sollten Sie die folgenden Einschränkungen kennen:
-
Nur semantische Suche: S3 Vectors unterstützt die semantische Suche, jedoch keine hybriden Suchfunktionen.
-
Größenbeschränkungen für S3-Vektoren: Jeder Vektor hat eine Gesamtgrößenbeschränkung für Metadaten und eine Größenbeschränkung für filterbare Metadaten, wodurch benutzerdefinierte Metadaten und Filteroptionen eingeschränkt werden können. Weitere Informationen zu Metadaten und filterbaren Metadaten-Größenbeschränkungen pro Vektor finden Sie unter Begrenzungen und Einschränkungen.
-
Einschränkungen der Chunking-Strategie: Auf Modelle beschränkt, die Inhalte aufgrund von Beschränkungen der Metadatengröße in Blöcke von bis zu 500 Tokens aufteilen.
-
Nur Gleitkomma-Vektoren: Binäre Vektoreinbettungen werden nicht unterstützt.
Umfassende Anleitungen zur Arbeit mit Amazon Bedrock Knowledge Bases finden Sie unter Daten abrufen und KI-Antworten mit Amazon Bedrock Knowledge Bases generieren im Amazon Bedrock User Guide.