Considérations et restrictions - AWS Glue

Considérations et restrictions

Les considérations et limites suivantes s'appliquent à la génération de statistiques de colonne.

Considérations
  • L'utilisation de l'échantillonnage pour générer des statistiques réduit le temps d'exécution, mais peut générer des statistiques inexactes.

  • Le catalogue de données ne stocke pas les différentes versions des statistiques.

  • Vous ne pouvez exécuter qu'une seule tâche de génération de statistiques à la fois par table.

  • Si une table est chiffrée à l'aide d'une clé client AWS KMS enregistrée dans le catalogue de données, AWS Glue utilise la même clé pour chiffrer les statistiques.

La tâche de statistiques de colonne prend en charge la génération de statistiques :
  • Lorsque le rôle IAM dispose d'autorisations complètes sur les tables (IAM ou Lake Formation).

  • Lorsque le rôle IAM dispose d'autorisations sur la table en utilisant le mode d'accès hybride de Lake Formation.

La tâche de statistiques de colonne ne prend pas en charge la génération de statistiques pour :
  • Tables avec contrôle d’accès basé sur les cellules de Lake Formation

  • Lacs de données transactionnels : Linux Foundation Delta Lake, Apache Hudi.

  • Tables dans des bases de données fédérées - Hive metastore, unités de partage des données d'Amazon Redshift

  • Colonnes imbriquées, tableaux et types de données struct.

  • Table partagée avec vous depuis un autre compte