Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Amazon S3 métadonnées du document
Vous pouvez ajouter des métadonnées, des informations supplémentaires sur un document, aux documents d'un Amazon S3 compartiment à l'aide d'un fichier de métadonnées. Chaque fichier de métadonnées est associé à un document indexé.
Vos fichiers de métadonnées doivent être stockés dans le même compartiment que vos fichiers indexés. Vous pouvez spécifier un emplacement dans le compartiment pour vos fichiers de métadonnées à l'aide de la console ou du S3Prefix champ du DocumentsMetadataConfiguration paramètre lorsque vous créez une source de Amazon S3 données. Si vous ne spécifiez aucun préfixe Amazon S3 , vos fichiers de métadonnées doivent être stockés au même endroit que vos documents indexés.
Si vous spécifiez un Amazon S3 préfixe pour vos fichiers de métadonnées, ceux-ci se trouvent dans une structure de répertoire parallèle à celle de vos documents indexés. Amazon Kendra recherche uniquement dans le répertoire spécifié pour vos métadonnées. Si les métadonnées ne sont pas lues, vérifiez que l’emplacement du répertoire correspond à celui de vos métadonnées.
Les exemples suivants illustrent la manière dont l’emplacement du document indexé est mappé à l’emplacement du fichier de métadonnées. Notez que la Amazon S3 clé du document est ajoutée au Amazon S3 préfixe des métadonnées, puis suffixée .metadata.json pour former le chemin du fichier de métadonnées. Amazon S3 La Amazon S3 clé combinée, avec le Amazon S3 préfixe et le .metadata.json suffixe des métadonnées, ne doit pas comporter plus de 1024 caractères au total. Il est recommandé de ne pas dépasser 1 000 caractères pour tenir compte des caractères supplémentaires lorsque vous combinez votre clé avec le préfixe et le suffixe. Amazon S3
Bucket name:
s3://bucketName
Document path:
documents
Metadata path:
none
File mapping
s3://bucketName/documents/file.txt ->
s3://bucketName/documents/file.txt.metadata.jsonBucket name:
s3://bucketName
Document path:
documents/legal
Metadata path:
metadata
File mapping
s3://bucketName/documents/legal/file.txt ->
s3://bucketName/metadata/documents/legal/file.txt.metadata.jsonLes métadonnées de votre document sont définies dans un fichier JSON. Le fichier doit être un fichier texte UTF-8 sans marqueur BOM. Le nom du fichier JSON doit être <document>.<extension>.metadata.json. Dans cet exemple, « document » est le nom du document auquel s'appliquent les métadonnées et « extension » est l'extension de fichier du document. L’ID de document doit être unique dans <document>.<extension>.metadata.json.
Le contenu du fichier JSON suit ce modèle. Tous attributes/fields sont facultatifs, il n'est donc pas nécessaire d'inclure tous les attributs. Vous devez fournir une valeur pour chaque attribut que vous souhaitez inclure ; la valeur ne peut pas être vide. Si vous ne spécifiez pas le_source_uri, les liens renvoyés par Amazon Kendra les résultats de recherche pointent vers le Amazon S3 compartiment contenant le document. DocumentIdest mappé au champ s3_document_id et représente le chemin absolu vers le document dans S3.
{ "DocumentId": "S3 document ID, the S3 path to doc", "Attributes": { "_category": "document category", "_created_at": "ISO 8601 encoded string", "_last_updated_at": "ISO 8601 encoded string", "_source_uri": "document URI", "_version": "file version", "_view_count":number of times document has been viewed, "custom attribute key": "custom attribute value",additional custom attributes}, "AccessControlList": [ { "Name": "user name", "Type": "GROUP|USER", "Access": "ALLOW|DENY" } ], "Title": "document title", "ContentType": "For example HTML|
Les champs de métadonnées _created_at et _last_updated_at sont des dates codées ISO 8601. Par exemple, 2012-03-25T12:30:10+01:00 est le format de date et d’heure ISO 8601 pour le 25 mars 2012 à 12 h 30 (plus 10 secondes) dans le fuseau horaire de l’heure d’Europe centrale.
Vous pouvez ajouter des informations supplémentaires au Attributes champ concernant un document que vous utilisez pour filtrer les requêtes ou pour regrouper les réponses aux requêtes. Pour de plus amples informations, veuillez consulter Création de champs de document personnalisés.
Vous pouvez utiliser le champ AccessControlList pour filtrer la réponse d’une requête. De cette manière, seuls certains utilisateurs et groupes ont accès aux documents. Pour de plus amples informations, veuillez consulter Filtrage sur le contexte utilisateur.