Verwenden von S3-Vektoren mit Amazon Bedrock Knowledge Bases - Amazon Simple Storage Service

Verwenden von S3-Vektoren mit Amazon Bedrock Knowledge Bases

Anmerkung

Amazon S3 Vectors befindet sich in der Vorabversion für Amazon Simple Storage Service und unterliegt noch Änderungen.

S3 Vectors lässt sich in Amazon Bedrock Knowledge Bases und Amazon SageMaker AI Unified Studio integrieren, um die Vektorspeicherung für Retrieval Augmented Generation (RAG)-Anwendungen zu vereinfachen und die Kosten zu senken.

Weitere Informationen zu CLI-Befehlen auf hoher Ebene, die Amazon Bedrock-Einbettungsmodelle in S3 Vectors-Operationen integrieren, finden Sie unter.

Übersicht über die Integration

Wenn Sie eine Wissensdatenbank in Amazon Bedrock erstellen, können Sie S3 Vectors als Ihren Vektorspeicher auswählen. Diese Integration bietet Folgendes:

  • Kosteneinsparungen für RAG-Anwendungen mit großen Vektordatensätzen.

  • Nahtlose Integration mit dem vollständig verwalteten RAG-Workflow von Amazon Bedrock.

  • Automatisches Vektormanagement, das vom Amazon Bedrock-Service abgewickelt wird.

  • Abfragelatenz von weniger als einer Sekunde beim Abrufen von Wissensdatenbanken.

Amazon Bedrock Knowledge Bases bietet einen vollständig verwalteten, durchgängigen RAG-Workflow. Wenn Sie mit S3 Vectors eine Wissensdatenbank erstellen, ruft Amazon Bedrock automatisch Daten aus Ihrer S3-Datenquelle ab, konvertiert Inhalte in Textblöcke, generiert Einbettungen und speichert sie in Ihrem Vektorindex. Anschließend können Sie die Wissensdatenbank abfragen und Antworten auf der Grundlage von Blöcken generieren, die aus Ihren Quelldaten abgerufen wurden.

Wann sollte diese Integration verwendet werden

Erwägen Sie die Verwendung von S3 Vectors mit Amazon Bedrock Knowledge Bases, wenn Sie Folgendes benötigen:

  • Kostengünstiger Vektorspeicher für große Datensätze, bei denen die Abfragelatenz von weniger als einer Sekunde Ihren Anwendungsanforderungen entspricht.

  • Text- und bildgestützter Abruf von Dokumenten für Anwendungsfälle wie das Durchsuchen von Handbüchern, Richtlinien und visuellen Inhalten.

  • RAG-Anwendungen, die der Optimierung der Speicherkosten Vorrang vor Reaktionen mit extrem niedriger Latenz einräumen.

  • Verwaltete Vektoroperationen, ohne sich direkt mit den Operationen der S3-Vektoren-API vertraut machen zu müssen – Sie können weiterhin die vertrauten Amazon Bedrock-Schnittstellen verwenden.

  • Langfristiger Vektorspeicher mit der Haltbarkeit und Skalierbarkeit von Amazon S3

Diese Integration ist ideal für Unternehmen, die RAG-Anwendungen entwickeln, die geschriebene Inhalte und Bilder durchsuchen und Erkenntnisse daraus gewinnen müssen, wobei die Kostenvorteile von S3 Vectors mit akzeptablen Anforderungen an die Abfrageleistung übereinstimmen müssen.

Unterstützte Einbettungsmodelle

Die S3 Vectors-Integration mit Amazon Bedrock Knowledge Bases unterstützt die folgenden Einbettungsmodelle:

  • amazon.titan-embed-text-v2:0 – Für textbasierte Einbettungen

  • amazon.titan-embed-image-v1 – Für Bild- und multimodale Einbettungen

  • cohere.embed-english-v3 – Für mehrsprachige und spezialisierte Text-Einbettungen

Voraussetzungen und Berechtigungen

Bevor Sie eine Wissensdatenbank mit S3 Vectors erstellen, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Entsprechende IAM-Berechtigungen für S3 Vectors und Amazon Bedrock Services. Weitere Informationen zu IAM-Berechtigungen für S3 Vectors finden Sie unter Identity and Access Management in Amazon S3 Vectors. Weitere Informationen zu IAM-Berechtigungen für Ihre Amazon Bedrock Knowledge Bases-Servicerolle für den Zugriff auf S3 Vectors finden Sie unter Zugriffsberechtigungen für Ihren Vector Store in Amazon S3 Vectors im Amazon Bedrock-Benutzerhandbuch.

  • Ihre Quelldokumente sind für die Aufnahme in die Wissensdatenbank vorbereitet.

  • Ein Verständnis Ihrer Anforderungen an das Einbettungsmodell.

Bei der Einrichtung von Sicherheitskonfigurationen können Sie eine IAM-Rolle wählen, die Amazon Bedrock die Berechtigung zum Zugriff auf die erforderlichen AWS Services gewährt. Sie können die Servicerolle von Amazon Bedrock erstellen lassen oder Ihre eigene benutzerdefinierte Rolle verwenden. Wenn Sie eine benutzerdefinierte Rolle verwenden, konfigurieren Sie eine Vektor-Bucket-Richtlinie, die den Zugriff auf den Vektor-Bucket und den Vektorindex auf die benutzerdefinierte Rolle beschränkt.

Ausführliche Informationen zu den erforderlichen Berechtigungen und IAM-Rollen finden Sie unter Erstellen einer Servicerolle für Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch. Die Servicerolle muss außerdem über Berechtigungen für S3-Vektoren und AWS KMS API-Operationen verfügen.

Erstellen einer Wissensdatenbank mit S3 Vectors

Sie können eine Wissensdatenbank, die S3-Vektoren verwendet, auf zwei Arten erstellen.

Methode 1: Verwendung der Amazon Bedrock-Konsole

Wenn Sie eine Wissensdatenbank in der Amazon Bedrock-Konsole erstellen, können Sie „S3-Vektor-Bucket“ als Ihre Option für den Vektorspeicher auswählen. Sie haben zwei Einrichtungsoptionen:

Eine ausführliche schrittweise Anleitung finden Sie unter Erstellen einer Wissensdatenbank durch Herstellen einer Verbindung zu einer Datenquelle in Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch.

Methode zwei: Verwenden von Amazon SageMaker Unified Studio

Sie können Wissensdatenbanken auch mit S3 Vectors über Amazon Bedrock in Amazon SageMaker AI Unified Studio erstellen und verwalten. Dies bietet eine einheitliche Entwicklungsumgebung zum Erstellen und Testen von KI-Anwendungen, die Wissensdatenbanken verwenden.

Amazon Bedrock in SageMaker AI Unified Studio wurde für Benutzer entwickelt, die integrierte Notebook-Funktionen benötigen und mit mehreren AWS ML- und Analytikservices arbeiten. Sie können schnell einen S3-Vektor-Bucket erstellen und ihn als Vektorspeicher für Ihre Wissensdatenbanken konfigurieren, wenn Sie generative KI-Anwendungen erstellen.

Informationen zur Verwendung von S3 Vectors mit Amazon Bedrock in SageMaker AI Unified Studio finden Sie unter Hinzufügen einer Datenquelle zu Ihrer Amazon Bedrock-Anwendung im SageMaker AI Unified Studio-Benutzerhandbuch.

Verwaltung Ihrer Wissensdatenbank und Abfrage Ihrer Wissensdatenbank

Datensynchronisierung und -verwaltung

Amazon Bedrock Knowledge Bases bietet Ingestion-Job-Operationen, um Ihre Datenquellen- und Vektoreinbettungen synchron zu halten. Wenn Sie Ihre Datenquelle synchronisieren, scannt Amazon Bedrock jedes Dokument und überprüft, ob es im Vector Store indexiert wurde. Sie können Dokumente auch direkt mit der Operation IngestKnowledgeBaseDocuments in den Vektorspeicher indizieren. Es hat sich bewährt, für jede Wissensdatenbank einen eigenen Vektorspeicher zu erstellen, um die Datensynchronisierung sicherzustellen.

Wenn Sie eine Wissensdatenbank oder Datenquelle löschen, bietet Amazon Bedrock zwei Richtlinien zum Löschen von Daten an: Delete (Standard) und Retain. Wenn Sie die Richtlinie Delete auswählen, werden Vektoren im Vektorindex und im Vektor-Bucket automatisch gelöscht.

Abfragen und Abrufen

Nachdem Ihre Wissensdatenbank eingerichtet ist, haben Sie folgende Optionen:

Die Antworten werden mit Verweisen auf die ursprünglichen Quelldaten zurückgesendet.

Einschränkungen

Wenn Sie S3 Vectors mit Amazon Bedrock Knowledge Bases verwenden, sollten Sie die folgenden Einschränkungen kennen:

  • Nur semantische Suche: S3 Vectors unterstützt die semantische Suche, jedoch keine hybriden Suchfunktionen.

  • Größenbeschränkungen für S3-Vektoren: Jeder Vektor hat eine Gesamtgrößenbeschränkung für Metadaten und eine Größenbeschränkung für filterbare Metadaten, wodurch benutzerdefinierte Metadaten und Filteroptionen eingeschränkt werden können. Weitere Informationen zu Metadaten und filterbaren Metadaten-Größenbeschränkungen pro Vektor finden Sie unter Begrenzungen und Einschränkungen.

  • Einschränkungen der Chunking-Strategie: Auf Modelle beschränkt, die Inhalte aufgrund von Beschränkungen der Metadatengröße in Blöcke von bis zu 500 Tokens aufteilen.

  • Nur Gleitkomma-Vektoren: Binäre Vektoreinbettungen werden nicht unterstützt.

Umfassende Anleitungen zur Arbeit mit Amazon Bedrock Knowledge Bases finden Sie unter Daten abrufen und KI-Antworten mit Amazon Bedrock Knowledge Bases generieren im Amazon Bedrock User Guide.