Migración de tablas existentes a Iceberg - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Migración de tablas existentes a Iceberg

Esta sección se centra en la migración de las tablas de estilo Hive existentes al formato Iceberg. Se aplica a las tablas que utilizan formatos tradicionales compatibles con Hive, como Apache Parquet o Apache ORC. Esta información no se aplica a las tablas que ya utilizan formatos de tabla modernos, como Linux Foundation, Delta Lake o Apache Hudi.

Para migrar sus tablas actuales de estilo Hive al formato Iceberg, puede utilizar la migración de datos local o completa: 

  • La migración in situ es el proceso de generar los archivos de metadatos de Iceberg sobre los archivos de datos existentes.

  • La migración completa de datos crea la capa de metadatos de Iceberg y también reescribe los archivos de datos existentes de la tabla original a la nueva tabla de Iceberg.

En las siguientes secciones se proporciona una descripción detallada de cada método de migración, incluidas step-by-step las instrucciones y consideraciones para su implementación. Para obtener más información sobre estas estrategias de migración, consulte la sección sobre migración de tablas de la documentación de Iceberg.

Tras revisar los detalles de los métodos de migración de datos internos y completos, consulta las dos secciones clave siguientes para ayudarte en el proceso de toma de decisiones:

  • La elección de una estrategia de migración proporciona orientación a través de una serie de preguntas y escenarios que le ayudarán a determinar el enfoque de migración más adecuado en función de sus requisitos y casos de uso específicos.

  • El resumen de las opciones de migración proporciona una tabla completa en la que se comparan las características y consideraciones clave de las diferentes opciones de migración. Esta tabla sirve como guía de referencia rápida y ofrece una comparación de características para ayudarle a comprender las desventajas técnicas entre los métodos.