Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Stellen Sie für Ihre Wissensdatenbank eine Connect zu Amazon S3 her
Amazon S3 ist ein Objektspeicherdienst, der Daten als Objekte in Buckets speichert. Sie können eine Verbindung zu Ihrem Amazon S3 S3-Bucket für Ihre Amazon Bedrock-Wissensdatenbank herstellen, indem Sie entweder die AWS Management-Konsole für Amazon Bedrock
Sie können mithilfe der Amazon S3-Konsole oder API einen kleinen Stapel von Dateien in einen Amazon S3 S3-Bucket hochladen. Sie können AWS DataSyncalternativ mehrere Dateien kontinuierlich auf S3 hochladen und Dateien nach einem Zeitplan von der lokalen Infrastruktur, dem Edge, einer anderen Cloud oder einem AWS Speicher übertragen.
Derzeit werden nur S3-Buckets für allgemeine Zwecke unterstützt.
Die Anzahl der Dateien und MB pro Datei, die gecrawlt werden können, ist begrenzt. Informationen zu Wissensdatenbanken finden Sie unter Kontingente.
Unterstützte Features
-
Felder für Dokument-Metadaten
-
Filter für Inklusionsinhalte
-
Inkrementelle Inhaltssynchronisierung für hinzugefügte, aktualisierte und gelöschte Inhalte
Voraussetzungen
Stellen Sie in Amazon S3 sicher, dass Sie:
-
Notieren Sie sich die Amazon S3 S3-Bucket-URI, den Amazon-Ressourcennamen (ARN) und die AWS Konto-ID für den Besitzer des Buckets. Sie finden den URI und den ARN im Eigenschaftenbereich der Amazon S3 S3-Konsole. Ihr Bucket muss sich in derselben Region wie Ihre Amazon Bedrock-Wissensdatenbank befinden. Sie müssen über die Berechtigung verfügen, auf den Bucket zuzugreifen.
Stellen Sie in Ihrem AWS Konto sicher, dass Sie:
-
Nehmen Sie die erforderlichen Berechtigungen für die Verbindung mit Ihrer Datenquelle in Ihre AWS Identity and Access Management (IAM) role/permissions -Richtlinie für Ihre Wissensdatenbank auf. Informationen zu den erforderlichen Berechtigungen für diese Datenquelle, um sie Ihrer IAM Wissensdatenbank-Rolle hinzuzufügen, finden Sie unter Berechtigungen für den Zugriff auf Datenquellen.
Anmerkung
Wenn Sie die Konsole verwenden, kann die IAM Rolle mit allen erforderlichen Berechtigungen im Rahmen der Schritte zum Erstellen einer Wissensdatenbank für Sie erstellt werden. Nachdem Sie Ihre Datenquelle und andere Konfigurationen konfiguriert haben, wird die IAM Rolle mit allen erforderlichen Berechtigungen auf Ihre spezifische Wissensdatenbank angewendet.
Konfiguration der Verbindung
Um eine Verbindung zu Ihrem Amazon S3 S3-Bucket herzustellen, müssen Sie die erforderlichen Konfigurationsinformationen angeben, damit Amazon Bedrock auf Ihre Daten zugreifen und sie crawlen kann. Sie müssen auch dem folgen. Voraussetzungen
Ein Beispiel für eine Konfiguration für diese Datenquelle ist in diesem Abschnitt enthalten.
Weitere Informationen zu Inklusionsfiltern, Feldern für Dokumentmetadaten, inkrementeller Synchronisierung und deren Funktionsweise finden Sie unter den folgenden Optionen:
Sie können eine separate Datei hinzufügen, die die Dokument-Metadaten fields/attributes für jede Datei in Ihrer Amazon S3 S3-Datenquelle angibt und angibt, ob sie bei der Indizierung der Datenquelle im Vector Store in die Einbettungen aufgenommen werden sollen. Sie können beispielsweise eine Datei im folgenden Format erstellen, sie benennen example.metadata.json
und in Ihren S3-Bucket hochladen.
{ "metadataAttributes": { "company": { "value": { "type": "STRING", "stringValue": "BioPharm Innovations" }, "includeForEmbedding": true }, "created_date": { "value": { "type": "NUMBER", "numberValue": 20221205 }, "includeForEmbedding": true }, "author": { "value": { "type": "STRING", "stringValue": "Lisa Thompson" }, "includeForEmbedding": true }, "origin": { "value": { "type": "STRING", "stringValue": "Overview" }, "includeForEmbedding": true } } }
Die Metadatendatei muss denselben Namen wie die zugehörige Quelldokumentdatei verwenden, wobei der Name an das Ende des Dateinamens .metadata.json
angehängt wird. Die Metadatendatei muss in demselben Ordner oder Speicherort wie die Quelldatei in Ihrem Amazon S3 S3-Bucket gespeichert werden. Die Datei darf das Limit von 10 KB nicht überschreiten. Informationen zu den unterstützten attribute/field Datentypen und den Filteroperatoren, die Sie auf Ihre Metadatenfelder anwenden können, finden Sie unter Metadaten und Filterung.
Sie können ein Inklusionspräfix angeben, bei dem es sich um ein Amazon S3 S3-Pfadpräfix handelt, wobei Sie eine S3-Datei oder einen Ordner anstelle des gesamten Buckets verwenden können, um den S3-Datenquellenconnector zu erstellen. Ihr Präfix kann beispielsweise „.*\\ .pdf“ sein.
Der Datenquellen-Connector crawlt bei jeder Synchronisierung Ihrer Datenquelle mit Ihrer Wissensdatenbank neue, geänderte und gelöschte Inhalte. Amazon Bedrock kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu crawlen, die sich seit der letzten Synchronisierung geändert haben. Wenn Sie Ihre Datenquelle zum ersten Mal mit Ihrer Wissensdatenbank synchronisieren, werden alle Inhalte standardmäßig gecrawlt.
Um Ihre Datenquelle mit Ihrer Wissensdatenbank zu synchronisieren, verwenden Sie die StartIngestionJobAPI oder wählen Sie Ihre Wissensdatenbank in der Konsole aus und wählen Sie im Bereich Datenquellenübersicht die Option Synchronisieren aus.
Wichtig
Alle Daten, die Sie aus Ihrer Datenquelle synchronisieren, stehen allen Personen zur Verfügung, die zum bedrock:Retrieve
Abrufen der Daten berechtigt sind. Dies kann auch alle Daten mit kontrollierten Datenquellenberechtigungen einschließen. Weitere Informationen finden Sie unter Knowledgebase-Berechtigungen.