

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Optimiseurs de tables au niveau du catalogue
<a name="catalog-level-optimizers"></a>

Avec une configuration de catalogue unique, vous pouvez configurer des optimiseurs automatiques tels que le compactage, la conservation des instantanés et la suppression des fichiers orphelins pour toutes les tables Apache Iceberg nouvelles et mises à jour dans l’ AWS Glue Data Catalog. Les configurations d’optimiseur au niveau du catalogue vous permettent d’appliquer des paramètres d’optimisation cohérents à toutes les tables d’un catalogue, éliminant ainsi le besoin de configurer les optimiseurs individuellement pour chaque table.

Les administrateurs de lac de données peuvent configurer les optimiseurs de table en sélectionnant le catalogue par défaut dans la console Lake Formation et en activant les optimiseurs à l’aide de l’option `Table optimization`. Lorsque vous créez des tables ou que vous mettez à jour des tables existantes dans le catalogue de données, ce dernier exécute automatiquement les optimisations des tables afin de réduire la charge opérationnelle.

Si vous avez configuré l’optimisation au niveau de la table ou si vous avez précédemment supprimé les paramètres d’optimisation des tables pour une table, ces paramètres propres à la table ont priorité sur les paramètres du catalogue par défaut pour l’optimisation des tables. Si aucun paramètre de configuration n’est défini au niveau de la table ou du catalogue, la valeur de propriété de la table Iceberg sera appliquée. Ce paramètre s’applique à la conservation des instantanés et à l’optimiseur de suppression de fichiers orphelins.

Tenez compte des éléments suivants lorsque vous activez les optimisateurs au niveau du catalogue :
+ Lorsque vous configurez les paramètres d’optimisation au moment de la création du catalogue, puis que vous désactivez les optimisations par le biais d’une demande de mise à jour du catalogue, l’opération se répercute sur toutes les tables du catalogue.
+ Si vous avez déjà configuré des optimiseurs pour une table donnée, l’opération de désactivation au niveau du catalogue n’aura aucun impact sur cette table.
+ Lorsque vous désactivez les optimiseurs au niveau du catalogue, les tables présentant des configurations d’optimiseur existantes conservent leurs paramètres spécifiques et ne sont pas affectées par les modifications apportées au niveau du catalogue. Toutefois, les tables dépourvues de leur propre configuration d’optimiseur hériteront de l’état désactivé au niveau du catalogue.
+ Étant donné que les optimiseurs de conservation des instantanés et de suppression de fichiers orphelins peuvent être basés sur un calendrier, les mises à jour introduiront un retard aléatoire dans le début de leur calendrier. Cela entraînera le démarrage de chaque optimiseur à des heures légèrement différentes, répartissant ainsi la charge et réduisant le risque de dépassement des limites de service.
+ Les paramètres de l'optimiseur au niveau du catalogue ne sont pas automatiquement hérités par les tables lorsque le AWS Glue Data Catalog chiffrement est activé. Si le chiffrement des métadonnées est activé dans votre catalogue, vous devez configurer les optimiseurs de table individuellement pour chaque table. Pour utiliser l'héritage de l'optimiseur au niveau du catalogue, le chiffrement des métadonnées doit être désactivé dans le catalogue.

**Topics**
+ [Activation de l’optimisation automatique des tables au niveau du catalogue](enable-auto-table-optimizers.md)
+ [Affichage des optimisations au niveau du catalogue](view-catalog-optimizations.md)
+ [Désactivation de l’optimisation des tables au niveau du catalogue](disable-auto-table-optimizers.md)

# Activation de l’optimisation automatique des tables au niveau du catalogue
<a name="enable-auto-table-optimizers"></a>

 Vous pouvez activer l’optimisation automatique des tables pour toutes les nouvelles tables Apache Iceberg du catalogue de données. Après avoir créé la table, vous pouvez également mettre à jour manuellement de manière explicite les paramètres d’optimisation des tables. 

 Pour mettre à jour les paramètres du catalogue de données afin de permettre l’optimisation des tables au niveau du catalogue, le rôle IAM utilisé doit disposer de l’autorisation `glue:UpdateCatalog` sur le catalogue racine. Vous pouvez utiliser l’API `GetCatalog` pour vérifier les propriétés du catalogue. 

 Pour les tables gérées par Lake Formation, le rôle IAM sélectionné lors de la configuration d’optimisation du catalogue a besoin des autorisations Lake Formation `ALTER`, `DESCRIBE`, `INSERT` et `DELETE` pour toute nouvelle table ou pour les tables mises à jour. 

## Pour activer les optimiseurs au niveau du catalogue (console)
<a name="enable-catalog-optimizers-console"></a>

1. Ouvrez la console Lake Formation à l'adresse [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com/lakeformation/).

1. Dans le panneau de navigation, choisissez **catalogue de données**.

1. Sélectionnez l’onglet **Catalogues**.

1. Choisissez le catalogue au niveau du compte.

1. Choisissez **Optimisations des tables**, puis **Modifier** sous l’onglet **Optimisations des tables**. Vous pouvez également choisir **Modifier les optimisations** dans **Actions**.  
![\[La capture d’écran montre l’option de modification permettant d’activer les optimisations au niveau du catalogue.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/catalog-edit-optimizations.png)

1. Sur la page **Optimisation des tables**, configurez les options suivantes :  
![\[La capture d’écran montre les options d’optimisation au niveau du catalogue.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/catalog-optimization-options.png)

   1. Configurez les paramètres de **compactage** :
      + Activez/désactivez le compactage.
      + Choisissez le rôle IAM disposant des autorisations nécessaires pour exécuter les optimiseurs.

        Pour en savoir plus sur les autorisations requises pour le rôle IAM, consultez [Conditions préalables requises pour l’optimisation des tables](optimization-prerequisites.md).

   1. Configurez les paramètres de **conservation des instantanés** :
      + Activez/désactivez la conservation.
      + Définissez la période de conservation des instantanés en jours. La valeur par défaut est de cinq jours.
      + Définissez le nombre d’instantanés à retenir. La valeur par défaut est d’un instantané.
      + Activez/désactivez le nettoyage des fichiers expirés.

   1. Configurez les paramètres de **suppression des fichiers orphelins** :
      + Activez/désactivez la suppression des fichiers orphelins.
      + Définissez la période de conservation des fichiers orphelins en jours. La valeur par défaut est de trois jours.

1. Choisissez **Enregistrer**.

## Activation des optimiseurs au niveau du catalogue via AWS CLI
<a name="catalog-auto-optimizers-cli"></a>

Utilisez la commande CLI suivante pour mettre à jour un catalogue existant avec les paramètres de l’optimiseur :

**Example Mise à jour du catalogue avec les paramètres de l’optimiseur**  

```
aws glue update-catalog \
   --name catalog-id \
  --catalog-input \
  '{
    "CatalogId": "111122223333",
    "CatalogInput": {
        "CatalogProperties": {
            "CustomProperties": {
                "ColumnStatistics.Enabled": "false",
                "ColumnStatistics.RoleArn": "arn:aws:iam::111122223333:role/service-role/stats-role-name"
            },
            "IcebergOptimizationProperties": {
                "RoleArn": "arn:aws:iam::111122223333:role/optimizer-role-name",
                "Compaction": {
                    "enabled": "true"
                },
                "Retention": {
                    "enabled": "true",
                    "snapshotRetentionPeriodInDays": "10",
                    "numberOfSnapshotsToRetain": "5",
                    "cleanExpiredFiles": "true"
                },
                "OrphanFileDeletion": {
                    "enabled": "true",
                    "orphanFileRetentionPeriodInDays": "3"
                }
            }
        }
    }
}'
```

Si vous rencontrez des problèmes avec les optimiseurs au niveau du catalogue, vérifiez les points suivants :
+ Assurez-vous que le rôle IAM dispose des autorisations appropriées, comme indiqué dans la section Conditions préalables.
+ Consultez les CloudWatch journaux pour détecter tout message d'erreur lié aux opérations de l'optimiseur.

   Pour de plus amples informations, consultez [Affichage des métriques disponibles](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/viewing_metrics_with_cloudwatch.html) dans le *Guide de l'utilisateur Amazon CloudWatch *. 
+ Vérifiez que les paramètres du catalogue ont été correctement appliqués en vérifiant la configuration du catalogue.
+ En cas d'échec d'accès aux tables, consultez les CloudWatch journaux et EventBridge les notifications pour obtenir des informations détaillées sur les erreurs.

# Affichage des optimisations au niveau du catalogue
<a name="view-catalog-optimizations"></a>

 Lorsque l'optimisation des tables au niveau du catalogue est activée, chaque fois qu'une table Apache Iceberg est créée ou mise à jour via le `CreateTable` SDK ou AWS Glue crawler qu'un paramètre de niveau de table équivalent est créé pour cette table. `UpdateTable` APIs AWS Management Console

 Après avoir créé ou mis à jour une table, vous pouvez vérifier ses détails pour confirmer son optimisation. `Table optimization` affiche la propriété `Configuration source` définie comme `Catalog`. 

![\[Une image d’une table Apache Iceberg avec une configuration d’optimisation au niveau du catalogue a été appliquée.\]](http://docs.aws.amazon.com/fr_fr/glue/latest/dg/images/catalog-optimization-enabled.png)


# Désactivation de l’optimisation des tables au niveau du catalogue
<a name="disable-auto-table-optimizers"></a>

 Vous pouvez désactiver l'optimisation des tables pour les nouvelles tables à l'aide de la AWS Lake Formation console, l'`glue:UpdateCatalog`API. 

**Pour désactiver les optimisations des tables au niveau du catalogue**

1. Ouvrez la console Lake Formation à l'adresse [https://console.aws.amazon.com/lakeformation/](https://console.aws.amazon.com/lakeformation/).

1. Dans la barre de navigation de gauche, choisissez **Catalogues**.

1. Sur la page **Résumé du catalogue**, choisissez **Modifier** sous **Optimisations des tables**.

1. Sur la page **Modifier l’optimisation**, désélectionnez les **options d’optimisation**.

1. Choisissez **Enregistrer**.