Generación de estadísticas de las columnas de las tablas de Iceberg - AWS Glue

Generación de estadísticas de las columnas de las tablas de Iceberg

Siga estos pasos para configurar una programación para generar estadísticas en el Catálogo de datos mediante la consola de AWS Glue o la AWS CLI, o ejecute la operación StartColumnStatisticsTaskRun.

Generación de estadísticas de columnas
  1. Inicie sesión en la consola de AWS Glue en https://console.aws.amazon.com/glue/.

  2. Seleccione Tablas en el Catálogo de datos.

  3. Seleccione una tabla de Iceberg de la lista.

  4. Seleccione Generar estadísticas, Generar bajo demanda en el menú Acciones.

    También puede pulsar el botón Generar estadísticas en la pestaña Estadísticas de columnas, en la sección inferior de la página de Tablas.

  5. En la página Generar estadísticas, proporcione los detalles de generación de estadísticas. Siga los pasos 6 a 11 de la sección Generación de estadísticas de columnas según una programación a fin de configurar una programación para la generación de estadísticas de las tablas de Iceberg.

    También puede optar por generar estadísticas de columnas bajo demanda si sigue las instrucciones en Generación de estadísticas de columnas bajo demanda

    nota

    La opción de muestreo no está disponible para las tablas de Iceberg.

    AWS Glue calcula el número de valores distintos de cada columna de la tabla de Iceberg en un nuevo archivo Puffin asignado al ID de instantánea especificado en la ubicación de su instancia de Amazon S3.