

# Optimización del rendimiento de las consultas en tablas de Iceberg
<a name="iceberg-column-statistics"></a>

Apache Iceberg es un formato de tabla abierto de alto rendimiento para conjuntos de datos de análisis de gran tamaño. AWS Glue permite calcular y actualizar el número de valores distintos (NDV) para cada columna de las tablas de Iceberg. Estas estadísticas pueden facilitar una mejor optimización de las consultas, administración de los datos y eficiencia del rendimiento para los ingenieros y científicos de datos que trabajan con conjuntos de datos a gran escala.

 AWS Glue calcula el número de valores distintos de cada columna de la tabla de Iceberg y los almacena en archivos [Puffin](https://iceberg.apache.org/puffin-spec/) de Amazon S3 asociados a las instantáneas de la tabla de Iceberg. Puffin es un formato de archivo de Iceberg diseñado para almacenar metadatos como índices, estadísticas y bocetos. El almacenamiento de bocetos en archivos Puffin vinculados a instantáneas garantiza la coherencia de las transacciones y la actualización de las estadísticas de NDV.

Puede configurarlo para ejecutar la tarea de generación de estadísticas de columnas mediante la consola AWS Glue o AWS CLI. Al iniciar el proceso, AWS Glue inicia un trabajo de Spark en segundo plano y actualiza los metadatos de la tabla AWS Glue en el catálogo de datos. Puede ver las estadísticas de las columnas mediante la consola AWS Glue o AWS CLI, o llamando a la operación de la API [GetColumnStatisticsForTable](https://docs.aws.amazon.com/glue/latest/webapi/API_GetColumnStatisticsForTable.html).

**nota**  
Si utiliza los permisos de AWS Lake Formation para controlar el acceso a la tabla, el rol que asume la tarea de estadísticas de columnas requiere acceso total a la tabla para generar estadísticas.

**Topics**
+ [Requisitos previos para generar estadísticas de columnas](iceberg-column-stats-prereqs.md)
+ [Generación de estadísticas de las columnas de las tablas de Iceberg](iceberg-generate-column-stats.md)
+ [Véase también](#see-also-iceberg-stats)

## Véase también
<a name="see-also-iceberg-stats"></a>
+ [Visualización de estadísticas de columnas](view-column-stats.md)
+ [Visualización de las ejecuciones de tareas de estadísticas de columnas](view-stats-run.md)
+ [Detener la ejecución de la tarea de estadísticas de columnas](stop-stats-run.md)
+ [Eliminar estadísticas de columnas](delete-column-stats.md)