既存のテーブルを Iceberg に移行する - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

既存のテーブルを Iceberg に移行する

このセクションでは、既存の Hive スタイルのテーブルを Iceberg 形式に移行することに重点を置いています。これは、Apache Parquet や Apache ORC などの従来の Hive 互換形式を使用するテーブルに適用されます。この情報は、Linux Foundation Delta Lake や Apache Hudi などの最新のテーブル形式を既に使用しているテーブルには適用されません。

現在の Hive スタイルのテーブルを Iceberg 形式に移行するには、インプレースまたはフルデータ移行を使用できます。 

  • インプレース移行は、既存のデータファイルの上に Iceberg のメタデータファイルを生成するプロセスです。

  • フルデータ移行は Iceberg メタデータレイヤーを作成し、既存のデータファイルを元のテーブルから新しい Iceberg テーブルに書き換えます。

以下のセクションでは、実装に関するstep-by-stepの手順や考慮事項など、各移行方法の詳細な概要を説明します。これらの移行戦略の詳細については、Iceberg ドキュメントの「テーブル移行」セクションを参照してください。

インプレースおよびフルデータ移行方法の詳細を確認したら、次の 2 つの主要なセクションを参照して意思決定プロセスに役立ててください。

  • 移行戦略を選択すると、一連の質問とシナリオを通じてガイダンスが提供され、特定の要件とユースケースに基づいて最適な移行アプローチを決定できます。

  • 移行オプションの概要は、さまざまな移行オプションの主要な特性と考慮事項を比較する包括的な表を提供します。この表はクイックリファレンスガイドとして機能し、メソッド間の技術的なトレードオフを理解するのに役立つ機能比較を提供します。