Amazon S3 Metadaten des Dokuments - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon S3 Metadaten des Dokuments

Mithilfe einer Metadatendatei können Sie Metadaten, zusätzliche Informationen zu einem Dokument, zu Dokumenten in einem Amazon S3 Bucket hinzufügen. Jede Metadatendatei ist einem indizierten Dokument zugeordnet.

Ihre Metadatendateien müssen im selben -Bucket wie Ihre indexierten Dateien gespeichert werden. Sie können einen Speicherort innerhalb des Buckets für Ihre Metadatendateien angeben, indem Sie die Konsole oder das S3Prefix Feld des DocumentsMetadataConfiguration Parameters verwenden, wenn Sie eine Amazon S3 Datenquelle erstellen. Wenn Sie kein Amazon S3 -Präfix angeben, müssen Ihre Metadatendateien am selben Ort wie Ihre indexierten Dokumente gespeichert werden.

Wenn Sie ein Amazon S3 Präfix für Ihre Metadatendateien angeben, befinden sie sich in einer Verzeichnisstruktur parallel zu Ihren indizierten Dokumenten. Amazon Kendra sucht nur im angegebenen Verzeichnis nach Ihren Metadaten. Wenn die Metadaten nicht gelesen werden, überprüfen Sie, ob der Speicherort des Verzeichnisses mit dem Speicherort Ihrer Metadaten übereinstimmt.

Die folgenden Beispiele zeigen, wie der Speicherort des indexierten Dokuments dem Speicherort der Metadatendatei zugeordnet wird. Beachten Sie, dass der Amazon S3 Schlüssel des Dokuments an das Amazon S3 Präfix der Metadaten angehängt und dann mit einem Suffix versehen wird, .metadata.json um den Pfad der Metadatendatei zu bilden. Amazon S3 Der kombinierte Amazon S3 Schlüssel mit dem Amazon S3 Präfix und .metadata.json Suffix der Metadaten darf insgesamt nicht mehr als 1024 Zeichen lang sein. Es wird empfohlen, dass Sie Ihren Amazon S3 Schlüssel unter 1000 Zeichen halten, um zusätzliche Zeichen bei der Kombination Ihres Schlüssels mit dem Präfix und dem Suffix zu berücksichtigen.

Bucket name: s3://bucketName Document path: documents Metadata path: none File mapping s3://bucketName/documents/file.txt -> s3://bucketName/documents/file.txt.metadata.json
Bucket name: s3://bucketName Document path: documents/legal Metadata path: metadata File mapping s3://bucketName/documents/legal/file.txt -> s3://bucketName/metadata/documents/legal/file.txt.metadata.json

Die Metadaten Ihres Dokuments sind in einer JSON-Datei definiert. Die Datei muss eine UTF-8-Textdatei ohne BOM-Markierung sein. Der Dateiname der JSON-Datei muss <document>.<extension>.metadata.json sein. In diesem Beispiel ist „Dokument“ der Name des Dokuments, für das sich die Metadaten beziehen, und „Erweiterung“ ist die Dateierweiterung für das Dokument. Die Dokument-ID muss in <document>.<extension>.metadata.json eindeutig sein.

Der Inhalt der JSON-Datei folgt dieser Vorlage. Alle attributes/fields sind optional, sodass es nicht erforderlich ist, alle Attribute einzubeziehen. Sie müssen für jedes Attribut, das Sie einbeziehen möchten, einen Wert angeben. Der Wert darf nicht leer sein. Wenn Sie den nicht angeben_source_uri, verweisen die von Amazon Kendra in den Suchergebnissen zurückgegebenen Links auf den Amazon S3 Bucket, der das Dokument enthält. DocumentIdist dem Feld zugeordnet s3_document_id und ist der absolute Pfad zum Dokument in S3.

{ "DocumentId": "S3 document ID, the S3 path to doc", "Attributes": { "_category": "document category", "_created_at": "ISO 8601 encoded string", "_last_updated_at": "ISO 8601 encoded string", "_source_uri": "document URI", "_version": "file version", "_view_count": number of times document has been viewed, "custom attribute key": "custom attribute value", additional custom attributes }, "AccessControlList": [ { "Name": "user name", "Type": "GROUP | USER", "Access": "ALLOW | DENY" } ], "Title": "document title", "ContentType": "For example HTML | PDF. For supported content types, see Types of documents." }

Die Metadatenfelder _created_at und _last_updated_at sind nach ISO 8601 kodierte Datumsangaben. Beispiel: 2012-03-25T12:30:10+01:00 ist das ISO-8601-Datums-/Uhrzeitformat für den 25. März 2012 um 12:30 Uhr (plus 10 Sekunden) in mitteleuropäischer Zeit (CET).

Sie können dem Attributes Feld über ein Dokument zusätzliche Informationen hinzufügen, die Sie zum Filtern von Abfragen oder zum Gruppieren von Abfrageantworten verwenden. Weitere Informationen finden Sie unter Benutzerdefinierte Dokumentfelder erstellen.

Sie können das AccessControlList-Feld verwenden, um die Antwort aus einer Abfrage zu filtern. Auf diese Weise haben nur bestimmte Benutzer und Gruppen Zugriff auf Dokumente. Weitere Informationen finden Sie unter Filtern nach Benutzerkontext.