Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Localisation de votre liste d’inventaire
Lorsqu’une liste d’inventaire est publiée, les fichiers manifestes sont publiés dans l’emplacement suivant dans le compartiment de destination.
destination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/YYYY-MM-DDTHH-MMZ
/manifest.jsondestination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/YYYY-MM-DDTHH-MMZ
/manifest.checksumdestination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/hive/dt=YYYY-MM-DD-HH-MM
/symlink.txt
-
est le préfixe de nom de la clé d’objet défini de manière facultative dans la configuration de l’inventaire. Vous pouvez utiliser ce préfixe pour regrouper tous les fichiers de liste d’inventaire dans un emplacement commun au sein du compartiment de destination.destination-prefix
-
est le compartiment source pour lequel la liste d’inventaire est effectuée. Le nom du compartiment source est ajouté pour éviter les collisions lorsque plusieurs rapports d’inventaire de différents compartiments source sont envoyés dans le même compartiment de destination.amzn-s3-demo-source-bucket
-
est ajouté pour éviter les collisions avec plusieurs rapports d’inventaire du même compartiment source qui sont envoyés dans le même compartiment de destination. Leconfig-ID
provient de la configuration de rapport d’inventaire et est le nom du rapport défini lors de la configuration.config-ID
-
est l’horodatage composé de l’heure de début et de la date à laquelle la génération de rapport d’inventaire a commencé à analyser le compartiment, par exemple,YYYY-MM-DDTHH-MMZ
2016-11-06T21-32Z
. -
manifest.json
est le fichier manifeste. -
manifest.checksum
est le MD5 hachage du contenu dumanifest.json
fichier. -
symlink.txt
est le fichier manifeste compatible avec Apache Hive.
Les listes d’inventaire sont publiées sur une base quotidienne ou hebdomadaire dans l’emplacement suivant dans le compartiment de destination.
destination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/data/example-file-name.csv.gz
...destination-prefix
//
amzn-s3-demo-source-bucket
config-ID
/data/example-file-name-1.csv.gz
-
est le préfixe de nom de la clé d'objet défini de manière facultative dans la configuration de l'inventaire. Vous pouvez utiliser ce préfixe pour regrouper tous les fichiers de liste d’inventaire dans un emplacement commun au sein du compartiment de destination.destination-prefix
-
est le compartiment source pour lequel la liste d’inventaire est effectuée. Le nom du compartiment source est ajouté pour éviter les collisions lorsque plusieurs rapports d'inventaire de différents compartiments source sont envoyés dans le même compartiment de destination.amzn-s3-demo-source-bucket
-
example-file-name
.csv.gz
est l’un des fichiers de l’inventaire CSV. Les noms d’inventaire ORC se terminent par l’extension de nom de fichier.orc
et les noms d’inventaire Parquet se terminent par l’extension de nom de fichier.parquet
.
Manifeste d’inventaire
Les fichiers manifestes manifest.json
et symlink.txt
décrivent l’emplacement où les fichiers d’inventaire sont situés. Lorsqu’une nouvelle liste d’inventaire est fournie, elle est accompagnée d’un nouvel ensemble de fichiers manifestes. Ces fichiers peuvent s’écraser les uns les autres. Dans les compartiments activés pour la gestion des versions, Amazon S3 crée de nouvelles versions des fichiers de manifeste.
Chaque manifeste contenu dans le fichier manifest.json
fournit des métadonnées et d’autres informations de base sur un inventaire. Les informations collectées sont les suivantes :
-
Nom de compartiment source
-
Nom du compartiment de destination
-
Version de l’inventaire
-
Horodatage de création, au format de date d’époque, composé de l’heure de début et de la date à laquelle le processus de génération de rapport d’inventaire a commencé à analyser le compartiment
-
Format et schéma des fichiers d’inventaire
-
Liste des fichiers d’inventaire se trouvant dans le compartiment de destination
Chaque fois qu'un manifest.json
fichier est écrit, il est accompagné d'un manifest.checksum
fichier qui est le MD5 hachage du contenu du manifest.json
fichier.
Exemple Manifeste d’inventaire dans un fichier manifest.json
Voici des exemples de manifeste d’inventaire dans un fichier manifest.json
pour les inventaires au format CSV, ORC et Parquet.
Le fichier symlink.txt
est un fichier manifeste compatible avec Apache Hive qui permet à Hive de découvrir automatiquement les fichiers d’inventaire et leurs fichiers de données associés. Le manifeste compatible avec Hive fonctionne avec les services Athena et Amazon Redshift Spectrum compatibles avec Hive. Il fonctionne également avec les applications compatibles avec Hive, notamment Presto
Important
Le fichier manifeste compatible avec symlink.txt
Apache Hive ne fonctionne pas avec AWS Glue actuellement.
La lecture du fichier symlink.txt
avec Apache Hive