Scelta di una strategia di migrazione - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Scelta di una strategia di migrazione

Quando si passa al formato Iceberg, la scelta tra migrazione sul posto e migrazione completa è fondamentale. Per determinare l'approccio più adatto alle vostre esigenze specifiche, prendete in considerazione le seguenti domande e raccomandazioni:

Domanda Raccomandazione

Qual è il formato del file di dati (ad esempio, CSV o Apache Parquet)?

  • Prendi in considerazione la migrazione sul posto se il formato di file tabellare è Parquet, ORC o Avro.

  • Per altri formati come CSV, JSON e così via, utilizza la migrazione completa dei dati.

Vuoi aggiornare o consolidare lo schema della tabella?

  • Se desideri far evolvere lo schema delle tabelle utilizzando le funzionalità native di Iceberg, prendi in considerazione la migrazione sul posto. Ad esempio, puoi rinominare le colonne dopo la migrazione. (Lo schema può essere modificato nel livello di metadati Iceberg.)

  • Se desideri rimuovere intere colonne perché non sono più necessarie, ti consigliamo di utilizzare la migrazione completa dei dati.

La tabella trarrebbe vantaggio dalla modifica della strategia di partizione?

  • Se l'approccio di partizionamento di Iceberg soddisfa i tuoi requisiti (ad esempio, i nuovi dati vengono archiviati utilizzando il nuovo layout delle partizioni mentre le partizioni esistenti rimangono invariate), prendi in considerazione la migrazione sul posto.

  • Se desideri utilizzare partizioni nascoste nella tua tabella, prendi in considerazione la migrazione completa dei dati. Per ulteriori informazioni sulle partizioni nascoste, consulta la sezione Best practice.

La tabella trarrebbe vantaggio dall'aggiunta o dalla modifica della strategia di ordinamento?

  • L'aggiunta o la modifica dell'ordinamento dei dati richiede la riscrittura del set di dati. In questo caso, valuta la possibilità di utilizzare la migrazione completa dei dati.

  • Per le tabelle di grandi dimensioni in cui riscrivere tutte le partizioni delle tabelle è proibitivo, prendi in considerazione l'utilizzo della migrazione sul posto e l'esecuzione della compattazione (con l'ordinamento abilitato) per le partizioni a cui si accede più frequentemente.

La tabella contiene molti file di piccole dimensioni?

  • L'unione di file di piccole dimensioni in file più grandi richiede la riscrittura del set di dati. In questo caso, valuta la possibilità di utilizzare la migrazione completa dei dati.

  • Per le tabelle di grandi dimensioni in cui riscrivere tutte le partizioni delle tabelle è proibitivo, prendi in considerazione l'utilizzo della migrazione sul posto e l'esecuzione della compattazione (con l'ordinamento abilitato) per le partizioni a cui si accede più frequentemente.