Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Riepilogo delle opzioni di migrazione
Questa tabella riassume le caratteristiche e le considerazioni principali per ciascuna opzione di migrazione.
Funzionalità |
Migrazione sul posto |
Migrazione sul posto |
Migrazione completa dei dati |
---|---|---|---|
Miglioramenti del layout dei dati come parte del processo di migrazione |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Formati di file supportati |
Parquet, Avro, ORC |
Parquet, Avro, ORC |
Parquet, Avro, ORC, JSON, CSV |
Sostituzione della tabella Source con una tabella Iceberg |
(crea una nuova tabella, ma con passaggi aggiuntivi è possibile sostituire la tabella di origine) |
(crea una tabella di backup e sostituisce la tabella di origine con una tabella Iceberg) |
(crea una nuova tabella) |
Impatto sulla tabella di origine |
|||
|
Corrompe la tabella di origine |
Corrompe la tabella di backup |
Sicuro, fonte inalterata |
Impatto del tavolo Iceberg |
|||
|
Corrompe la tabella Iceberg |
Corrompe la tabella Iceberg |
Nessun impatto sulla tabella Iceberg |
|
Non visibile nella nuova tabella (è necessario incorporare la partizione con |
Non visibile sulla nuova tabella (è necessario incorporare la partizione con |
Non visibile sulla nuova tabella (è necessario |
Costo |
Bassa |
Bassa |
Superiore (riscrittura completa dei dati) |
Velocità di migrazione |
Veloce |
Veloce |
Più lenta |
Può essere usato per migrare alle tabelle Amazon S3 |
|
|
|
Richiede DDL manuale |
(lo schema e le partizioni vengono copiati dalla tabella sorgente) |
(lo schema e le partizioni vengono copiati dalla tabella di origine) |
Se si utilizza CTAS, è necessario specificare solo il partizionamento |
Miglior utilizzo |
Migrazione rapida senza riscrivere i dati, che consente side-by-side l'uso di Hive e Iceberg per test o transizioni graduali. |
Sostituzione di una tabella Hive senza riscrivere i dati, quando è accettabile un passaggio immediato. |
Ottimizzazione completa di Iceberg con riscrittura dei dati. Ideale per riprogettare partizioni o schemi o migliorare il layout e le prestazioni. Sempre consigliato, se possibile. |