Amazon S3 Tables とテーブルバケットの使用

Amazon S3 Tables は、分析ワークロード用に最適化された S3 ストレージを提供し、クエリのパフォーマンスを継続的に向上させ、テーブルのストレージコストを削減するように設計された機能を備えています。S3 テーブルは、毎日の購入トランザクション、ストリーミングセンサーデータ、広告インプレッションなどの表形式データを保存するために専用に構築されています。表形式データは、データベーステーブルのように列と行のデータを表します。

S3 Tables のデータは、新しいバケットタイプ、つまりテーブルをサブリソースとして保存するテーブルバケットに保存されます。テーブルバケットは、Apache Iceberg 形式のテーブルの保存をサポートしています。標準 SQL ステートメントを使用すると、Amazon Athena、Amazon Redshift、Apache Spark などの Iceberg をサポートするクエリエンジンを使用してテーブルをクエリできます。

トピック

S3 Tables の機能

テーブルの専用ストレージ

S3 テーブルバケットは、テーブル用に特別に設計されています。テーブルバケットは、S3 汎用バケットのセルフマネージドテーブルと比較して、1 秒あたりのトランザクション (TPS) が高く、クエリスループットが向上します。テーブルバケットは、他の Amazon S3 バケットタイプと同じ耐久性、可用性、スケーラビリティを提供します。

の組み込みサポートApache Iceberg

テーブルバケット内のテーブルは Apache Iceberg 形式で保存されます。Iceberg をサポートするクエリエンジンで標準 SQL を使用してこれらのテーブルをクエリできます。Iceberg には、スキーマ進化やパーティション進化など、クエリパフォーマンスを最適化するためのさまざまな機能があります。

Iceberg を使用すると、クエリを再作成したり、データ構造を再構築したりすることなく、時間の経過とともに進化できるようにデータの整理方法を変更できます。Iceberg は、トランザクションのサポートを通じてデータの一貫性と信頼性を確保するように設計されています。問題を修正したり、タイムトラベルクエリを実行したりするのに役立つように、時間の経過とともにデータがどのように変化するかを追跡し、履歴バージョンにロールバックできます。

自動テーブル最適化

クエリ用テーブルを最適化するために、S3 は圧縮、スナップショット管理、参照されていないファイルの削除などの自動メンテナンスオペレーションを継続的に実行します。これらのオペレーションは、小さなオブジェクトを少数の大きなファイルに圧縮することで、テーブルのパフォーマンスを向上させます。また、メンテナンスオペレーションでは、未使用のオブジェクトをクリーンアップすることでストレージコストを削減できます。この自動メンテナンスにより、手動のテーブルメンテナンスの必要性が減ることで、大規模なデータレイクの運用が効率化されます。テーブルとテーブルバケットごとに、メンテナンス設定をカスタマイズできます。

アクセス管理とセキュリティ

AWS Organizations の AWS Identity and Access Management (IAM) とサービスコントロールポリシーを使用して、テーブルバケットと個々のテーブルの両方のアクセスを管理できます。S3 Tables は、Amazon S3 とは異なるサービス名前空間、つまり s3tables 名前空間を使用します。したがって、S3 Tables サービスとそのリソース専用のポリシーを設計できます。個々のテーブル、テーブル名前空間内のすべてのテーブル、またはテーブルバケット全体へのアクセスを許可するポリシーを設計できます。すべての Amazon S3 ブロックパブリックアクセス設定は、テーブルバケットに対して常に有効になっており、無効にすることはできません。

AWS 分析サービスとの統合

S3 コンソールを使用して、Amazon S3 テーブルバケットが AWS Glue Data Catalog に自動的に統合されるように設定できます。この統合により、AWS 分析サービスがテーブルデータを自動的に検出してアクセスできるようになります。統合後は、Amazon Athena、Amazon Redshift、Quick などの分析サービスを使用して、テーブルを操作できます。統合の動作方法の詳細については、「Amazon S3 Tables と AWS 分析サービスの統合」を参照してください。

Amazon S3 Tables とテーブルバケットの使用

トピック

S3 Tables の機能

関連サービス