Migrazione di tabelle esistenti su Iceberg

Questa sezione si concentra sulla migrazione delle tabelle esistenti in stile Hive al formato Iceberg. Si applica alle tabelle che utilizzano formati tradizionali compatibili con Hive come Apache Parquet o Apache ORC. Queste informazioni non si applicano alle tabelle che già utilizzano formati di tabella moderni come Linux Foundation Delta Lake o Apache Hudi.

Per migrare le attuali tabelle in stile Hive al formato Iceberg, puoi utilizzare la migrazione dei dati sul posto o completa:

La migrazione sul posto è il processo di generazione dei file di metadati di Iceberg su file di dati esistenti.
La migrazione completa dei dati crea il livello di metadati Iceberg e riscrive anche i file di dati esistenti dalla tabella originale alla nuova tabella Iceberg.

Le sezioni seguenti forniscono una panoramica dettagliata di ciascun metodo di migrazione, incluse step-by-step istruzioni e considerazioni per l'implementazione. Per ulteriori informazioni su queste strategie di migrazione, consulta la sezione Tabella Migrazione della documentazione di Iceberg.

Dopo aver esaminato i dettagli dei metodi di migrazione dei dati in uso e completi, consulta le due sezioni chiave seguenti per facilitare il processo decisionale:

La scelta di una strategia di migrazione fornisce indicazioni su una serie di domande e scenari, per aiutarvi a determinare l'approccio di migrazione più adatto in base a requisiti e casi d'uso specifici.
Il riepilogo delle opzioni di migrazione fornisce una tabella completa che confronta le caratteristiche e le considerazioni chiave tra le diverse opzioni di migrazione. Questa tabella funge da guida di riferimento rapida e offre un confronto delle funzionalità per aiutarti a comprendere i compromessi tecnici tra i metodi.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Utilizzo della versione 3 delle specifiche del formato di tabella Iceberg

Migrazione sul posto