Administración de la programación para la generación de estadísticas de columnas
Puede administrar las operaciones de programación, como actualizar, iniciar, detener y eliminar las programaciones para la generación de estadísticas de columnas en AWS Glue. Puede utilizar la consola de AWS Glue, la AWS CLI o las operaciones de la API de estadísticas de columnas de AWS Glue para realizar estas tareas.
Actualización de la programación para la generación de estadísticas de columnas
Puede actualizar la programación para activar la tarea de generación de estadísticas de columnas después de haberla creado. Puede utilizar la consola de AWS Glue, la AWS CLI o ejecutar la operación UpdateColumnStatisticsTaskSettings para actualizar la programación de una tabla. Puede modificar los parámetros de una programación existente, como el tipo de programación (bajo demanda o programada) y otros parámetros opcionales.
- Consola de administración de AWS
Para actualizar la configuración de una tarea de estadísticas de columnas
Inicie sesión en la consola de AWS Glue en https://console.aws.amazon.com/glue/.
Elija la tabla que desea actualizar de la lista de tablas.
En la sección inferior de la página de detalles de la tabla, elija Estadísticas de columnas.
En Acciones, elija Editar para actualizar la programación.
Realice los cambios que desee en la programación y seleccione Guardar.
- AWS CLI
-
Si no está utilizando la característica de generación de estadísticas de AWS Glue en la consola, puede actualizar manualmente la programación con el comando update-column-statistics-task-settings. En el siguiente ejemplo, se muestra cómo actualizar las estadísticas de las columnas mediante AWS CLI.
aws glue update-column-statistics-task-settings \
--database-name 'database_name' \
--table-name 'table_name' \
--role arn:aws:iam::123456789012:role/stats_role \
--schedule 'cron(0 0-5 16 * * ?)' \
--column-name-list 'col-1' \
--sample-size '20.0' \
--catalog-id '123456789012'\
--security-configuration 'test-security'
Detención de la programación para la generación de estadísticas de columnas
Si ya no necesita estadísticas incrementales, puede detener la generación programada para ahorrar recursos y costos. Pausar la programación no afecta las estadísticas generadas anteriormente. Puede reanudar la programación cuando lo desee.
- Consola de administración de AWS
Para detener la programación para una tarea de generación de estadísticas de columnas
En la consola AWS Glue, seleccione Tablas en el catálogo de datos.
Seleccione una tabla con estadísticas de columnas.
En la página de Detalles de la tabla, seleccione Estadísticas de columnas.
En Acciones, elija Generación programada y Pausar.
Seleccione Pausar para confirmar.
- AWS CLI
-
Para detener la programación de ejecución de una tarea de estadísticas de columnas mediante la AWS CLI, puede utilizar el siguiente comando:
aws glue stop-column-statistics-task-run-schedule \
--database-name ''database_name' \
--table-name 'table_name'
Reemplace database_name y table_name con los nombres reales de la base de datos y la tabla para las que desea detener la programación de ejecución de la tarea de estadísticas de columnas.
Reanudación de la programación para la generación de estadísticas de columnas
Si ha pausado la programación de generación de estadísticas, AWS Glue le permite reanudarla cuando lo desee. Puede reanudar la programación mediante la consola de AWS Glue, la AWS CLI o la operación StartColumnStatisticsTaskRunSchedule.
- Consola de administración de AWS
Para reanudar la programación para la generación de estadísticas de columnas
En la consola AWS Glue, seleccione Tablas en el catálogo de datos.
Seleccione una tabla con estadísticas de columnas.
En la página de Detalles de la tabla, seleccione Estadísticas de columnas.
En Acciones, elija Generación programada y Reanudar.
Seleccione Reanudar para confirmar.
- AWS CLI
-
Reemplace database_name y table_name con los nombres reales de la base de datos y la tabla para las que desea detener la programación de ejecución de la tarea de estadísticas de columnas.
aws glue start-column-statistics-task-run-schedule \
--database-name 'database_name' \
--table-name 'table_name'
Eliminación de la programación de estadísticas de columnas
Si bien por lo general se recomienda mantener las estadísticas actualizadas para obtener un rendimiento óptimo de las consultas, hay casos de uso específicos en los que eliminar la programación de generación automática podría resultar beneficioso.
Si los datos permanecen relativamente estáticos, las estadísticas de las columnas existentes pueden seguir siendo precisas durante un período prolongado, lo que reduce la necesidad de actualizaciones frecuentes. Eliminar la programación puede evitar el consumo innecesario de recursos y la sobrecarga asociada con la regeneración de estadísticas en datos que no sufren modificaciones.
Cuando se prefiere el control manual sobre la generación de estadísticas. Al eliminar la programación automática, los administradores pueden actualizar selectivamente las estadísticas de las columnas en intervalos específicos o después de cambios significativos en los datos, alineando el proceso con sus estrategias de mantenimiento y necesidades de asignación de recursos.
- Consola de administración de AWS
Cómo eliminar la programación de generación de estadísticas de columnas
En la consola AWS Glue, seleccione Tablas en el catálogo de datos.
Seleccione una tabla con estadísticas de columnas.
En la página de Detalles de la tabla, seleccione Estadísticas de columnas.
En Acciones, elija Generación programada y Eliminar.
Elija Eliminar para confirmar.
- AWS CLI
-
Reemplace database_name y table_name con los nombres reales de la base de datos y la tabla para las que desea detener la programación de ejecución de la tarea de estadísticas de columnas.
Puede eliminar la programación de estadísticas de las columnas mediante la operación de API DeleteColumnStatisticsTaskSettings o AWS CLI. En el ejemplo siguiente se muestra cómo eliminar la programación para generar estadísticas de columnas mediante AWS Command Line Interface (AWS CLI).
aws glue delete-column-statistics-task-settings \
--database-name 'database_name' \
--table-name 'table_name'