Usando o Apache Iceberg em AWS

Amazon Web Services (colaboradores)

Novembro de 2025 (histórico do documento)

O Apache Iceberg é um formato de tabela de código aberto que simplifica o gerenciamento de tabelas e melhora o desempenho. AWS serviços de análise, como Amazon EMR AWS Glue, Amazon Athena e Amazon Redshift, incluem suporte nativo para o Iceberg, para que você possa criar facilmente lagos de dados transacionais com base no Amazon Simple Storage Service (Amazon S3). AWS

Além disso, a próxima geração da Amazon SageMaker é construída em uma arquitetura de lakehouse aberta que unifica o acesso aos dados em lagos de dados, armazéns de AWS dados e fontes terceirizadas e federadas. O lakehouse é totalmente compatível com o Iceberg e oferece a flexibilidade de acessar e consultar dados no local usando a API REST do Iceberg.

Este guia técnico fornece orientação sobre como começar a usar o Iceberg em diferentes Serviços da AWSáreas e inclui as melhores práticas e recomendações para operar o Iceberg em grande escala e, AWS ao mesmo tempo, otimizar o custo e o desempenho.

Se você está apenas começando com o Iceberg ou é um usuário experiente que deseja otimizar suas cargas de trabalho existentes do Iceberg AWS, este guia oferece informações valiosas para cada estágio do seu projeto

Neste guia:

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Lagos de dados modernos