Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Personnalisation du comportement d’un robot
Lorsque vous configurez un AWS Glue crawler, vous disposez de plusieurs options pour configurer le comportement de votre robot.
-
Analyses incrémentielles : vous pouvez configurer un robot pour exécuter des analyses incrémentielles afin d’ajouter uniquement de nouvelles partitions au schéma de table.
-
Index de partition : un robot crée par défaut des index de partition pour les cibles Amazon S3 et Delta Lake afin de permettre une recherche efficace de partitions spécifiques.
-
Accélérez le temps d’analyse à l’aide des événements Amazon S3 : vous pouvez configurer un robot pour qu’il utilise les événements Amazon S3 afin d’identifier les changements entre deux analyses. Ce processus s’effectue en répertoriant tous les fichiers du sous-dossier qui a déclenché l’événement au lieu de répertorier la cible Amazon S3 ou du catalogue de données complète.
Gestion des modifications de schéma : vous pouvez empêcher un robot d’apporter des modifications au schéma existant. Vous pouvez utiliser l'AWS Management Console ou l'API AWS Glue pour configurer la façon dont votre crawler traite certains types de modifications.
-
Un seul schéma pour plusieurs chemins Amazon S3 : vous pouvez configurer un robot pour créer un seul schéma pour chaque chemin S3 si les données sont compatibles.
Emplacement des tables et niveaux de partitionnement : l’option de robot au niveau de la table vous offre la possibilité d’indiquer au robot où se trouvent les tables et comment vous souhaitez que les partitions soient créées.
Seuil de table : vous pouvez spécifier le nombre maximum de tables que le robot est autorisé à créer en spécifiant un seuil de table.
Informations d’identification AWS Lake Formation : vous pouvez configurer un robot pour qu’il utilise les informations d’identification Lake Formation en vue d’accéder à un entrepôt de données Amazon S3 ou à une table du catalogue de données avec un emplacement Amazon S3 sous-jacent au sein du même Compte AWS ou d’un autre Compte AWS.
Pour plus d'informations sur l'utilisation de la console AWS Glue pour ajouter un crawler, consultez Configuration d’un robot.
Rubriques
Planification d’analyses incrémentielles pour ajouter de nouvelles partitions.
Création d’un schéma unique pour chaque chemin d’inclusion Amazon S3
Spécification de l’emplacement de la table et du niveau de partitionnement
Spécification du nombre maximal de tables que le robot est autorisé à créer
Configuration d’un robot pour utiliser les informations d’identification de Lake Formation
Accélération des analyseurs à l’aide des notifications d’événements Amazon S3