Collecter et utiliser les statistiques des tables - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Collecter et utiliser les statistiques des tables

La collecte des statistiques des tables permet à l'optimiseur basé sur les coûts de Trino de prendre des décisions éclairées concernant les ordres de jointure, le filtrage et l'élagage des partitions, ce qui se traduit par de meilleures performances.

Vous pouvez utiliser la ANALYZE commande pour collecter des statistiques pour les tables Hive ou Iceberg :

ANALYZE sales;

La collecte de statistiques sur de larges tableaux peut être une lourde charge pour les ressources. Nous vous recommandons de spécifier un sous-ensemble de colonnes utilisées dans les jointures, les filtres ou les opérations de regroupement.

Il s'agit d'une autre commande utile. Il affiche les statistiques actuelles d'un tableau afin de vérifier si les statistiques sont à jour.

show stats for table_name;