Génération des index de partition - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Génération des index de partition

Le catalogue de données prend en charge la création d’index de partition afin de permettre une recherche efficace de partitions spécifiques. Pour en savoir plus, consultez Creating partition indexes. Le robot AWS Glue crée des index de partition pour les cibles Amazon S3 et Delta Lake par défaut.

the console
  1. Connectez-vous à la the console et ouvrez la console AWS Glue à l’adresse https://console.aws.amazon.com/glue/.

  2. Choisissez Robots dans le Catalogue de données.

  3. Lorsque vous définissez un robot, l’option permettant de créer automatiquement des index de partition est activée par défaut sous Options avancées, sur la page Définir la sortie et la planification.

    Pour désactiver cette option, vous pouvez décocher la case Créer des index de partition automatiquement dans la console.

  4. Complétez la configuration du robot et choisissez Créer un robot.

AWS CLI

Vous pouvez également désactiver cette option en utilisant l’AWS CLI et en définissant CreatePartitionIndex dans le paramètre configuration. La valeur par défaut est True.

aws glue update-crawler \ --name myCrawler \ --configuration '{"Version": 1.0, "CreatePartitionIndex": false }'

Notes d'utilisation pour les index de partition

  • Les tables créées par le Crawler ne contiennent pas la variable partition_filtering.enabled par défaut. Pour en savoir plus, consultez AWS Glue partition indexing and filtering.

  • La création d'index de partition pour les partitions chiffrées n'est pas prise en charge.