Utilisation des tables Iceberg à l'aide d'Amazon Data Firehose

Amazon Data Firehose est un service sans serveur et sans code permettant de diffuser des flux de données provenant de plus de 20 sources telles que les logs AWS WAF , Amazon Logs, Amazon CloudWatch Kinesis Data Streams et Amazon Managed Streaming for Apache Kafka (Amazon MSK) vers des destinations telles qu'Amazon S3, Amazon Redshift, Snowflake et Splunk. AWS IoT

Vous pouvez utiliser Firehose pour transmettre directement des données de streaming aux tables Apache Iceberg dans Amazon S3. À l'aide de Firehose, vous pouvez acheminer les enregistrements d'un seul flux vers différentes tables Apache Iceberg et appliquer automatiquement des opérations d'insertion, de mise à jour et de suppression aux enregistrements des tables. Firehose garantit une livraison en une seule fois sur les tables Iceberg. Cette fonctionnalité nécessite l'utilisation du AWS Glue Data Catalog.

Firehose peut également fournir directement des données de streaming aux tables Amazon S3. Ces tables fournissent un stockage optimisé pour les charges de travail analytiques à grande échelle et incluent des fonctionnalités qui améliorent en permanence les performances des requêtes et réduisent les coûts de stockage des données tabulaires.

Pour plus d'informations sur la configuration d'un flux Firehose afin de fournir des données aux tables Apache Iceberg, consultez Configurer le flux Firehose dans la documentation Firehose ou le billet de blog Diffusez des données en temps réel dans des tables Apache Iceberg dans Amazon S3 à l'aide d'Amazon Data Firehose.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utilisation des tables Iceberg à l'aide de Trino

Utilisation de tables Iceberg à l'aide d'Athena SQL