As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Resumo das opções de migração
Esta tabela resume as principais características e considerações de cada opção de migração.
Recurso |
Migração local |
Migração local |
Migração completa de dados |
---|---|---|---|
Melhorias no layout de dados como parte do processo de migração |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Formatos de arquivo compatíveis |
Parquet, Avro, ORC |
Parquet, Avro, ORC |
Parquete, Avro, ORC, JSON, CSV |
Substituição da tabela de origem por uma tabela Iceberg |
(cria uma nova tabela, mas com etapas adicionais você pode substituir a tabela de origem) |
(cria uma tabela de backup e substitui a tabela de origem por uma tabela Iceberg) |
(cria uma nova tabela) |
Impacto da tabela de origem |
|||
|
Corrompe a tabela de origem |
Corrompe a tabela de backup |
Seguro, fonte não afetada |
Impacto na mesa de iceberg |
|||
|
Corrompe a tabela Iceberg |
Corrompe a tabela Iceberg |
Sem impacto na mesa Iceberg |
|
Não visível na nova tabela (é necessário incorporar a partição com |
Não visível na nova tabela (é necessário incorporar a partição com |
Não visível na nova tabela (necessidade |
Custos |
Baixo |
Baixo |
Superior (regravação completa dos dados) |
Velocidade de migração |
Fast |
Fast |
Mais lento |
Pode ser usado para migrar para tabelas do Amazon S3 |
|
|
|
Requer DDL manual |
(o esquema e as partições são copiados da tabela de origem) |
(o esquema e as partições são copiados da tabela de origem) |
Se estiver usando CTAS, requer apenas a especificação do particionamento |
Melhor uso |
Migração rápida sem reescrever dados, permitindo o side-by-side uso do Hive e do Iceberg para testes ou transições graduais. |
Substituir uma tabela do Hive no local sem reescrever dados, quando uma transição imediata é aceitável. |
Otimização completa do Iceberg com reescrita de dados. Ideal para redesenhar partições ou esquemas ou melhorar o layout e o desempenho. Sempre recomendado, se possível. |