Optimisation de la conservation des instantanés
La fonctionnalité de conservation des instantanés Apache Iceberg permet aux utilisateurs d’interroger les données historiques à des moments précis et d’annuler les modifications indésirables apportées à leurs tables. Dans le Catalogue de données AWS Glue, la configuration de la conservation des instantanés contrôle la durée de conservation de ces instantanés (versions des données de table) avant leur expiration et leur suppression. Cela permet de gérer les coûts de stockage et la surcharge de métadonnées en supprimant automatiquement les anciens instantanés en fonction d’une période de conservation configurée ou du nombre maximal d’instantanés à conserver.
Vous pouvez configurer la période de conservation en jours et le nombre maximal d’instantanés à conserver pour une table. AWS Glue supprime les instantanés antérieurs à la période de conservation spécifiée des métadonnées de la table, tout en conservant les instantanés les plus récents dans les limites configurées. Après avoir supprimé les anciens instantanés des métadonnées, AWS Glue supprime les fichiers de données et de métadonnées correspondants qui ne sont plus référencés et qui sont propres aux instantanés expirés. Cela permet d’autoriser les requêtes Time Travel uniquement jusqu’aux instantanés conservés restants, tout en récupérant l’espace de stockage utilisé par les données d’instantanés expirés.