Migration de tables existantes vers Iceberg - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Migration de tables existantes vers Iceberg

Cette section se concentre sur la migration de vos tables de style Hive existantes vers le format Iceberg. Cela s'applique aux tables qui utilisent des formats compatibles Hive traditionnels tels que Apache Parquet ou Apache ORC. Ces informations ne s'appliquent pas aux tables qui utilisent déjà des formats de table modernes tels que Linux Foundation Delta Lake ou Apache Hudi.

Pour migrer vos tableaux actuels de style Hive vers le format Iceberg, vous pouvez utiliser la migration des données sur place ou complète : 

  • La migration sur place est le processus qui consiste à générer les fichiers de métadonnées d'Iceberg en plus des fichiers de données existants.

  • La migration complète des données crée la couche de métadonnées Iceberg et réécrit également les fichiers de données existants de la table d'origine vers la nouvelle table Iceberg.

Les sections suivantes fournissent un aperçu détaillé de chaque méthode de migration, y compris step-by-step les instructions et les considérations relatives à la mise en œuvre. Pour plus d'informations sur ces stratégies de migration, consultez la section Migration des tables de la documentation d'Iceberg.

Après avoir examiné les détails des méthodes de migration des données en place et complètes, consultez les deux sections clés suivantes pour faciliter votre processus de prise de décision :

  • Le choix d'une stratégie de migration fournit des conseils à travers une série de questions et de scénarios, afin de vous aider à déterminer l'approche de migration la plus appropriée en fonction de vos besoins spécifiques et de vos cas d'utilisation.

  • Le résumé des options de migration fournit un tableau complet qui compare les principales caractéristiques et considérations des différentes options de migration. Ce tableau sert de guide de référence rapide et propose une comparaison des fonctionnalités pour vous aider à comprendre les compromis techniques entre les méthodes.