Arbeiten mit Apache Iceberg-Tabellen mithilfe von Amazon Data Firehose - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Arbeiten mit Apache Iceberg-Tabellen mithilfe von Amazon Data Firehose

Amazon Data Firehose ist ein serverloser Service ohne Code für die Bereitstellung von Datenströmen aus über 20 Quellen wie AWS WAF Logs, Amazon CloudWatch Logs, Amazon Kinesis Data Streams und Amazon Managed Streaming for Apache Kafka (Amazon MSK) an Ziele wie Amazon S3, Amazon Redshift, Snowflake und Splunk. AWS IoT

Sie können Firehose verwenden, um Streaming-Daten direkt an Apache Iceberg-Tabellen in Amazon S3 zu übertragen. Mit Firehose können Sie Datensätze aus einem einzelnen Stream in verschiedene Apache Iceberg-Tabellen weiterleiten und automatisch Einfüge-, Aktualisierungs- und Löschvorgänge auf Datensätze in den Tabellen anwenden. Firehose garantiert die exakte Einmallieferung an die Tische von Iceberg. Diese Funktion erfordert die Verwendung von. AWS Glue Data Catalog

Firehose kann Streaming-Daten auch direkt an Amazon S3-Tabellen liefern. Diese Tabellen bieten Speicher, der für umfangreiche Analyse-Workloads optimiert ist, und enthalten Funktionen, die die Abfrageleistung kontinuierlich verbessern und die Speicherkosten für tabellarische Daten senken.

Informationen darüber, wie Sie einen Firehose-Stream einrichten, um Daten an Apache Iceberg-Tabellen zu liefern, finden Sie unter Den Firehose-Stream einrichten in der Firehose-Dokumentation.