翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Data Firehose を使用した Apache Iceberg テーブルの操作
Amazon Data Firehose は、 AWS WAF ログ、Amazon CloudWatch Logs、Amazon Kinesis Data Streams AWS IoT、Amazon Managed Streaming for Apache Kafka (Amazon MSK) などの 20 を超えるソースから Amazon S3、Amazon Redshift、Snowflake、Splunk などの宛先にデータストリームを配信するためのサーバーレスのノーコードサービスです。
Firehose を使用して、ストリーミングデータを Amazon S3 の Apache Iceberg テーブルに直接配信できます。Firehose を使用すると、単一のストリームから異なる Apache Iceberg テーブルにレコードをルーティングし、テーブル内のレコードに挿入、更新、削除オペレーションを自動的に適用できます。Firehose は、Iceberg テーブルへの 1 回限りの配信を保証します。この機能を使用するには、 AWS Glue Data Catalogを使用する必要があります。
Firehose は、ストリーミングデータを Amazon S3 テーブルに直接配信することもできます。これらのテーブルは、大規模な分析ワークロードに最適化されたストレージを提供し、クエリのパフォーマンスを継続的に改善し、表形式データのストレージコストを削減する機能が含まれています。
Apache Iceberg テーブルにデータを配信するように Firehose ストリームを設定する方法については、Firehose ドキュメントの「Firehose ストリームを設定する」またはブログ記事「Amazon Data Firehose を使用して Amazon S3 の Apache Iceberg テーブルにリアルタイムデータをストリーミング