Arbeiten mit Iceberg-Tabellen mithilfe von Amazon Data Firehose

Amazon Data Firehose ist ein serverloser Service ohne Code für die Bereitstellung von Datenströmen aus über 20 Quellen wie AWS WAF Logs, Amazon CloudWatch Logs, Amazon Kinesis Data Streams und Amazon Managed Streaming for Apache Kafka (Amazon MSK) an Ziele wie Amazon S3, Amazon Redshift, Snowflake und Splunk. AWS IoT

Sie können Firehose verwenden, um Streaming-Daten direkt an Apache Iceberg-Tabellen in Amazon S3 zu übertragen. Mit Firehose können Sie Datensätze aus einem einzelnen Stream in verschiedene Apache Iceberg-Tabellen weiterleiten und automatisch Einfüge-, Aktualisierungs- und Löschvorgänge auf Datensätze in den Tabellen anwenden. Firehose garantiert die exakte Einmallieferung an die Tische von Iceberg. Diese Funktion erfordert die Verwendung von. AWS Glue Data Catalog

Firehose kann Streaming-Daten auch direkt an Amazon S3-Tabellen liefern. Diese Tabellen bieten Speicher, der für umfangreiche Analyse-Workloads optimiert ist, und enthalten Funktionen, die die Abfrageleistung kontinuierlich verbessern und die Speicherkosten für tabellarische Daten senken.

Informationen zum Einrichten eines Firehose-Streams zur Bereitstellung von Daten an Apache Iceberg-Tabellen finden Sie unter Einrichten des Firehose-Streams in der Firehose-Dokumentation oder im Blogbeitrag Streamen von Echtzeitdaten in Apache Iceberg-Tabellen in Amazon S3 mit Amazon Data Firehose.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Arbeiten mit Iceberg-Tabellen mithilfe von Trino

Arbeiten mit Iceberg-Tabellen mithilfe von Athena SQL