Génération de statistiques de colonne pour les tables Iceberg - AWS Glue

Génération de statistiques de colonne pour les tables Iceberg

Procédez comme suit pour configurer un calendrier de génération de statistiques dans le catalogue de données à l’aide de la console AWS Glue ou de l’AWS CLI, ou exécutez l’opération StartColumnStatisticsTaskRun.

Pour générer des statistiques de colonne
  1. Connectez-vous à la console AWS Glue à l’adresse https://console.aws.amazon.com/glue/.

  2. Sélectionnez Tables sous Catalogue de données.

  3. Choisissez une table Iceberg dans la liste.

  4. Choisissez Statistiques de colonne, Générer à la demande dans le menu Actions.

    Vous pouvez également choisir le bouton Générer des statistiques sous l'onglet Statistiques de colonne dans la section inférieure de la page Tables.

  5. Sur la page Générer des statistiques, fournissez les détails relatifs à la génération des statistiques. Suivez les étapes 6 à 11 de la section Génération de statistiques de colonne selon un calendrier pour configurer un calendrier de génération de statistiques pour les tables Iceberg.

    Vous pouvez également choisir de générer des statistiques de colonnes à la demande en suivant les instructions de Génération de statistiques de colonne à la demande.

    Note

    L’option d’échantillonnage n’est pas disponible pour les tables Iceberg.

    AWS Glue calcule le nombre de valeurs distinctes pour chaque colonne de la table Iceberg dans un nouveau fichier Puffin validé avec l’ID d’instantané spécifié dans votre emplacement Amazon S3.