Entrega de dados às tabelas do Apache Iceberg com o Amazon Data Firehose

O Apache Iceberg é um formato de tabela de código aberto de alta performance para realizar análises de big data. O Apache Iceberg traz a confiabilidade e a simplicidade das tabelas SQL para os data lakes do Amazon S3 e possibilita que mecanismos de analytics de código aberto como Spark, Flink, Trino, Hive e Impala trabalhem simultaneamente com os mesmos dados. Para obter mais informações, consulte Apache Iceberg e Considerações e limitações.

É possível usar o Firehose para entregar dados de fluxo diretamente às tabelas do Apache Iceberg no Amazon S3. As tabelas do Apache Iceberg podem ser autogerenciadas no Amazon S3 ou hospedadas nas tabelas do Amazon S3. Nas tabelas autogerenciadas do Iceberg, você gerencia todas as otimizações da tabela, como compactação e expiração de snapshots. As Tabelas do Amazon S3 fornecem armazenamento otimizado para workloads de analytics em grande escala, com atributos que melhoram continuamente a performance das consultas e reduzem os custos de armazenamento de dados tabulares. Para ter mais informações sobre as Tabelas do Amazon S3, consulte Tabelas do Amazon S3.

Esse atributo permite rotear registros de um único fluxo para tabelas diferentes do Apache Iceberg. Você pode aplicar automaticamente as operações de inserção, atualização e exclusão aos registros nessas tabelas. Ele também suporta controle de acesso a dados refinado em tabelas Apache Iceberg no Amazon S3 com. AWS Lake Formation Você pode especificar controles de acesso centralmente AWS Lake Formation e fornecer permissões mais granulares em nível de tabela e coluna para o Firehose.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Pausa e retomada da entrega de dados

Considerações e limitações