PySpark ジョブでサポートされているデータ形式 SQL クエリでサポートされているデータ形式サポートされているデータ型のファイル圧縮タイプ AWS Clean Rooms のサーバー側の暗号化 AWS Clean Rooms

のデータ形式 AWS Clean Rooms

データを分析するには、データセットがが AWS Clean Rooms サポートする形式である必要があります。

トピック

PySpark ジョブでサポートされているデータ形式
SQL クエリでサポートされているデータ形式
サポートされているデータ型
のファイル圧縮タイプ AWS Clean Rooms
のサーバー側の暗号化 AWS Clean Rooms

PySpark ジョブでサポートされているデータ形式

AWS Clean Rooms は、PySpark ジョブを実行するために次の構造化形式をサポートしています。

Parquet
OpenCSV
JSON

SQL クエリでサポートされているデータ形式

AWS Clean Rooms は、SQL クエリを実行するために次の構造化形式をサポートしています。

Apache Iceberg テーブル
Parquet
OpenCSV
JSON

注記

テキストファイル内の timestamp 値は、yyyy-MM-dd HH:mm:ss.SSSSSS の形式である必要があります。例えば、2017-05-01 11:30:59.000000 です。

Apache Parquet など、列指向ストレージファイル形式を使用することをお勧めします。列指向ストレージファイル形式を使用すると、必要な列のみを選択することで、データの移動を最小限に抑えることができます。最適なパフォーマンスを得るには、大きなオブジェクトを 100 MB ～ 1 GB のオブジェクトに分割する必要があります。

サポートされているデータ型

AWS Clean Rooms は、次のデータ型をサポートしています。

配列
BIGINT
BOOLEAN
BYTE
CHAR
DATE
DECIMAL
FLOAT
INTEGER
INTERVAL
LONG
MAP
REAL
SHORT
SMALLINT
STRUCT
TIME
TIMESTAMP_LTZ
TIMESTAMP_NTZ
TINYINT
VARCHAR

詳細については、AWS Clean Rooms SQL リファレンスの「データ型」を参照してください。

のファイル圧縮タイプ AWS Clean Rooms

ストレージスペースの縮小、パフォーマンスの向上、コストの最小化を行うため、データセットを圧縮することを強くお勧めします。

AWS Clean Rooms は、ファイル拡張子に基づいてファイル圧縮タイプを認識し、次の表に示す圧縮タイプと拡張子をサポートします。

圧縮アルゴリズム	ファイル拡張子
GZIP	.gz
Bzip2	.bz2
Snappy	.snappy
Zstandard (Zstd)	.zstd

さまざまなレベルで圧縮を適用できます。通常、ファイル全体を圧縮するか、ファイル内の個々のブロックを圧縮します。ファイルレベルで列形式を圧縮しても、パフォーマンス上の利点はありません。

のサーバー側の暗号化 AWS Clean Rooms

注記

暗号化コンピューティングを必要とするユースケースで、サーバー側の暗号化が代わりの役割を果たすことはありません。

AWS Clean Rooms は、次の暗号化オプションを使用して暗号化されたデータセットを透過的に復号します。

SSE-S3 – Amazon S3 によって管理される AES-256 暗号化キーを使用したサーバー側暗号化。
SSE-KMS – によって管理されるキーによるサーバー側の暗号化 AWS Key Management Service

SSE-S3 を使用するには、設定済みテーブルをコラボレーションに関連付けるために使用される AWS Clean Rooms サービスロールに KMS 復号アクセス許可が必要です。SSE-KMS を使用するには、KMS キーポリシーで AWS Clean Rooms サービスロールの復号も許可する必要があります。

AWS Clean Rooms は Amazon S3 クライアント側の暗号化をサポートしていません。サーバー側の暗号化の詳細については、「Amazon Simple Storage Service ユーザーガイド」の「サーバー側の暗号化によるデータの保護」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

データテーブル

Apache Iceberg テーブル