As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Entrega de dados às tabelas do Apache Iceberg com o Amazon Data Firehose
O Apache Iceberg é um formato de tabela de código aberto de alta performance para realizar análises de big data. O Apache Iceberg traz a confiabilidade e a simplicidade das tabelas SQL para os data lakes do Amazon S3 e possibilita que mecanismos de análise de código aberto como Spark, Flink, Trino, Hive e Impala trabalhem com os mesmos dados simultaneamente. Para obter mais informações sobre o Apache Iceberg, consulte https://iceberg.apache.org/
É possível usar o Firehose para entregar dados de streaming às tabelas do Apache Iceberg no Amazon S3. Suas tabelas Apache Iceberg podem ser autogerenciadas no Amazon S3 ou hospedadas nas tabelas do Amazon S3. Nas tabelas autogerenciadas do Iceberg, você gerencia todas as otimizações da tabela, como compactação e expiração de instantâneos. A funcionalidade Tabelas do Amazon S3 fornece armazenamento otimizado para workloads de analytics em grande escala, com recursos que melhoram continuamente a performance das consultas e reduzem os custos de armazenamento de dados tabulares. Para obter mais informações sobre as tabelas do Amazon S3, consulte Tabelas do Amazon S3.
Esse recurso permite rotear registros de um único fluxo para diferentes tabelas Apache Iceberg. Você pode aplicar automaticamente as operações de inserção, atualização e exclusão aos registros nessas tabelas. Ele também suporta controle de acesso a dados refinado em tabelas Apache Iceberg no Amazon S3 com. AWS Lake Formation Você pode especificar controles de acesso centralmente AWS Lake Formation e fornecer permissões mais granulares em nível de tabela e coluna para o Firehose.