

# Optimizadores de tablas a nivel de catálogo
<a name="catalog-level-optimizers"></a>

Con una configuración de catálogo única, puede configurar optimizadores automáticos como la compactación, la retención de instantáneas y la eliminación de archivos huérfanos para todas las tablas de Apache Iceberg nuevas y actualizadas en el AWS Glue Data Catalog. Las configuraciones de los optimizadores a nivel de catálogo le permiten aplicar la misma configuración de optimización en todas las tablas de un catálogo, lo que elimina la necesidad de configurar los optimizadores individualmente para cada tabla.

Para configurar los optimizadores de tablas, los administradores de lagos de datos pueden seleccionar el catálogo predeterminado en la consola de Lake Formation y habilitar los optimizadores mediante la opción `Table optimization`. Al crear tablas nuevas o actualizar las tablas existentes en el Catálogo de datos, el Catálogo de datos ejecuta automáticamente las optimizaciones de las tablas para reducir la carga operativa.

Si configuró la optimización a nivel de la tabla o si eliminó previamente la configuración de optimización de una tabla, esa configuración específica de cada tabla tendrá prioridad sobre la configuración predeterminada del catálogo para la optimización de tablas. Si un parámetro de configuración no está definido ni a nivel de tabla ni de catálogo, se aplicará el valor de la propiedad de la tabla de Iceberg. Esta configuración se aplica al optimizador de retención de instantáneas y eliminación de archivos huérfanos.

Cuando habilite los optimizadores a nivel del catálogo, tenga en cuenta lo siguiente:
+ Si configura los ajustes de optimización cuando crea el catálogo y, posteriormente, deshabilita las optimizaciones mediante una solicitud de actualización del catálogo, la operación se extenderá en cascada a todas las tablas del catálogo.
+ Si ya ha configurado optimizadores para una tabla determinada, la operación de deshabilitación a nivel de catálogo no afectará esta tabla.
+ Si deshabilita los optimizadores a nivel de catálogo, las tablas con configuraciones de optimización existentes mantendrán sus ajustes específicos y no se verán afectadas por el cambio a nivel de catálogo. Sin embargo, las tablas que no tengan sus propias configuraciones de optimización heredarán el estado deshabilitado del nivel de catálogo.
+ Como los optimizadores para la retención de instantáneas y la eliminación de archivos huérfanos pueden basarse en una programación, las actualizaciones introducirán un retraso al azar en el inicio de su programación. Esto hará que cada optimizador se inicie en momentos ligeramente diferentes, lo que distribuirá la carga y reducirá la probabilidad de superar los límites de servicio.
+ La configuración del optimizador a nivel de catálogo no se hereda automáticamente en las tablas cuando el cifrado de AWS Glue Data Catalog está habilitado. Si el catálogo tiene habilitado el cifrado de metadatos, debe configurar los optimizadores de tabla de forma individual para cada tabla. Para utilizar la herencia de optimizadores a nivel de catálogo, el cifrado de metadatos debe estar desactivado en el catálogo.

**Topics**
+ [Habilitación de la optimización automática de tablas a nivel de catálogo](enable-auto-table-optimizers.md)
+ [Visualización de optimizaciones a nivel de catálogo](view-catalog-optimizations.md)
+ [Cómo deshabilitar la optimización de tablas a nivel de catálogo](disable-auto-table-optimizers.md)

# Habilitación de la optimización automática de tablas a nivel de catálogo
<a name="enable-auto-table-optimizers"></a>

 Puede habilitar la optimización automática de tablas para todas las tablas nuevas de Apache Iceberg en el Catálogo de datos. Tras crear la tabla, también puede actualizar de forma explícita y manual la configuración de la optimización de las tablas. 

 Para actualizar la configuración del Catálogo de datos y así poder habilitar las optimizaciones a nivel de catálogo, el rol de IAM que utiliza debe tener el permiso `glue:UpdateCatalog` en el catálogo raíz. Puede utilizar la API `GetCatalog` para verificar las propiedades del catálogo. 

 En el caso de las tablas gestionadas por Lake Formation, el rol de IAM seleccionado durante la configuración de la optimización del catálogo requiere los permisos `ALTER`, `DESCRIBE`, `INSERT`, y `DELETE` de Lake Formation para cualquier tabla nueva o actualizada. 

## Para habilitar los optimizadores a nivel de catálogo (consola)
<a name="enable-catalog-optimizers-console"></a>

1. Abra la consola de Lake Formation en [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com/lakeformation/).

1. En el panel de navegación, seleccione **Catálogo de datos**.

1. Seleccione la pestaña **Catálogos**.

1. Elija el catálogo a nivel de la cuenta.

1. Seleccione **Optimizaciones de tablas** y **Editar** en la pestaña **Optimizaciones de tablas**. También puede seleccionar **Editar optimizaciones** en **Acciones**.  
![\[La captura de pantalla muestra la opción de edición para habilitar las optimizaciones a nivel de catálogo.\]](http://docs.aws.amazon.com/es_es/glue/latest/dg/images/catalog-edit-optimizations.png)

1. En la página **Optimizaciones de tablas**, configure las siguientes opciones:  
![\[La captura de pantalla muestra las opciones de optimización a nivel de catálogo.\]](http://docs.aws.amazon.com/es_es/glue/latest/dg/images/catalog-optimization-options.png)

   1. Configure los ajustes de **Compactación**:
      + Habilite/deshabilite la compactación.
      + Elija el rol de IAM que tenga los permisos necesarios para ejecutar los optimizadores.

        Para obtener más información sobre los permisos necesarios para el rol de IAM, consulte [Requisitos previos para la optimización de tablas](optimization-prerequisites.md).

   1. Configure los ajustes de **Retención de instantáneas**:
      + Habilite/deshabilite la retención.
      + Establezca el período de retención de instantáneas en días; el valor predeterminado es de 5 días.
      + Establezca el número de instantáneas que se deben retener; el valor predeterminado es de 1 instantánea.
      + Habilite/deshabilite la limpieza de archivos caducados.

   1. Configure los ajustes de **Eliminación de archivos huérfanos**:
      + Habilite/deshabilite la eliminación de archivos huérfanos.
      + Establezca el período de retención de archivos huérfanos en días; el valor predeterminado es de 3 días.

1. Seleccione **Save**.

## Cómo habilitar los optimizadores a nivel de catálogo mediante AWS CLI
<a name="catalog-auto-optimizers-cli"></a>

Utilice el siguiente comando de la CLI para actualizar un catálogo existente con ajustes del optimizador:

**Example Actualice el catálogo con la configuración del optimizador**  

```
aws glue update-catalog \
   --name catalog-id \
  --catalog-input \
  '{
    "CatalogId": "111122223333",
    "CatalogInput": {
        "CatalogProperties": {
            "CustomProperties": {
                "ColumnStatistics.Enabled": "false",
                "ColumnStatistics.RoleArn": "arn:aws:iam::111122223333:role/service-role/stats-role-name"
            },
            "IcebergOptimizationProperties": {
                "RoleArn": "arn:aws:iam::111122223333:role/optimizer-role-name",
                "Compaction": {
                    "enabled": "true"
                },
                "Retention": {
                    "enabled": "true",
                    "snapshotRetentionPeriodInDays": "10",
                    "numberOfSnapshotsToRetain": "5",
                    "cleanExpiredFiles": "true"
                },
                "OrphanFileDeletion": {
                    "enabled": "true",
                    "orphanFileRetentionPeriodInDays": "3"
                }
            }
        }
    }
}'
```

Si tiene problemas con los optimizadores a nivel de catálogo, verifique lo siguiente:
+ Asegúrese de que el rol de IAM tenga los permisos correctos, tal como se describe en la sección Requisitos previos.
+ Revise los registros de CloudWatch para ver si hay algún mensaje de error relacionado con las operaciones del optimizador.

   Para obtener más información, consulte [Ver métricas disponibles](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/viewing_metrics_with_cloudwatch.html) en la *Guía del usuario de Amazon CloudWatch*. 
+ Compruebe que la configuración del catálogo se haya aplicado correctamente; para ello, verifique la configuración del catálogo.
+ En el caso de errores de acceso a las tablas, consulte los registros de CloudWatch y las notificaciones de EventBridge para obtener información detallada sobre los errores.

# Visualización de optimizaciones a nivel de catálogo
<a name="view-catalog-optimizations"></a>

 Cuando se habilita la optimización de tablas a nivel de catálogo, cada vez que se crea o actualiza una tabla de Apache Iceberg mediante las API `CreateTable` o `UpdateTable` a través de la Consola de administración de AWS, un SDK o la Rastreador de AWS Glue, se crea una configuración a nivel de tabla equivalente para esa tabla. 

 Después de crear o actualizar una tabla, puede verificar los detalles de esta para confirmar la optimización de tablas. `Table optimization` muestra el conjunto de propiedades `Configuration source` como `Catalog`. 

![\[Se aplicó una imagen de una tabla de Apache Iceberg con una configuración de optimización a nivel de catálogo.\]](http://docs.aws.amazon.com/es_es/glue/latest/dg/images/catalog-optimization-enabled.png)


# Cómo deshabilitar la optimización de tablas a nivel de catálogo
<a name="disable-auto-table-optimizers"></a>

 Puede deshabilitar la optimización de tablas para tablas nuevas mediante la consola de AWS Lake Formation, la API `glue:UpdateCatalog`. 

**Para deshabilitar las optimizaciones de las tablas a nivel de catálogo**

1. Abra la consola de Lake Formation en [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com/lakeformation/).

1. En la barra de navegación izquierda, elija **Claves**.

1. En la página **Resumen del catálogo**, seleccione **Editar** en **Optimizaciones de tablas**.

1. En la página **Editar optimización**, anule la selección de **Opciones de optimización**.

1. Seleccione **Save**.