Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Resumen de las opciones de migración
En esta tabla se resumen las principales características y consideraciones de cada opción de migración.
Característica |
Migración in situ |
Migración in situ |
Migración completa de datos |
---|---|---|---|
Mejoras en el diseño de los datos como parte del proceso de migración |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Formatos de archivo compatibles |
Parquet, Avro, ORC |
Parquet, Avro, ORC |
Parquet, Avro, ORC, JSON, CSV |
Sustitución de la tabla fuente por una tabla Iceberg |
(crea una tabla nueva, pero con pasos adicionales puede reemplazar la tabla de origen) |
(crea una tabla de respaldo y sustituye la tabla de origen por una tabla Iceberg) |
(crea una tabla nueva) |
Impacto en la tabla de origen |
|||
|
Corrompe la tabla de fuentes |
Daña la tabla de respaldo |
Seguro, la fuente no se ve afectada |
Impacto en una mesa de iceberg |
|||
|
Daña la tabla Iceberg |
Corrompe la mesa Iceberg |
No afecta a la mesa Iceberg |
|
No está visible en la tabla nueva (es necesario incorporar una partición con |
No está visible en la nueva tabla (es necesario incorporar una partición con |
No está visible en la nueva tabla (necesito |
Costo |
Bajo |
Bajo |
Más alto (reescritura completa de los datos) |
Velocidad de migración |
Rápido |
Rápido |
Más lento |
Se puede usar para migrar a Amazon S3 Tables |
|
|
|
Requiere un DDL manual |
(el esquema y las particiones se copian de la tabla fuente) |
(el esquema y las particiones se copian de la tabla fuente) |
Si usa CTAS, solo requiere especificar la partición |
El mejor uso |
Migración rápida sin reescribir los datos, lo que permite side-by-side utilizar Hive e Iceberg para realizar pruebas o realizar una transición gradual. |
Sustituir una tabla de Hive sin tener que volver a escribir los datos cuando sea aceptable un cambio inmediato. |
Optimización completa de Iceberg con reescritura de datos. Ideal para rediseñar particiones o esquemas, o para mejorar el diseño y el rendimiento. Se recomienda siempre que sea posible. |