

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# のデータ形式 AWS Clean Rooms
<a name="data-formats"></a>

データを分析するには、データセットが が AWS Clean Rooms サポートする形式である必要があります。

**Topics**
+ [PySpark ジョブでサポートされているデータ形式](#supported-data-formats-pyspark)
+ [SQL クエリでサポートされているデータ形式](#supported-data-formats)
+ [サポートされているデータ型](#data-types)
+ [のファイル圧縮タイプ AWS Clean Rooms](#compression-types)
+ [のサーバー側の暗号化 AWS Clean Rooms](#server-side-encryption)

## PySpark ジョブでサポートされているデータ形式
<a name="supported-data-formats-pyspark"></a>

AWS Clean Rooms は、PySpark ジョブを実行するために次の構造化形式をサポートしています。
+ Parquet
+ OpenCSV
+ JSON

## SQL クエリでサポートされているデータ形式
<a name="supported-data-formats"></a>

AWS Clean Rooms は、SQL クエリを実行するために次の構造化形式をサポートしています。
+ [Apache Iceberg テーブル](iceberg-tables.md)
+ Parquet
+ OpenCSV
+ JSON

**注記**  
テキストファイル内の `timestamp` 値は、`yyyy-MM-dd HH:mm:ss.SSSSSS` の形式である必要があります。例えば、`2017-05-01 11:30:59.000000` です。

Apache Parquet など、列指向ストレージファイル形式を使用することをお勧めします。列指向ストレージファイル形式を使用すると、必要な列のみを選択することで、データの移動を最小限に抑えることができます。最適なパフォーマンスを得るには、大きなオブジェクトを 100 MB ～ 1 GB のオブジェクトに分割する必要があります。

## サポートされているデータ型
<a name="data-types"></a>

AWS Clean Rooms は、次のデータ型をサポートしています。
+ 配列
+ BIGINT
+ BOOLEAN
+ BYTE
+ CHAR
+ DATE
+ DECIMAL
+ FLOAT
+ INTEGER
+ INTERVAL
+ LONG
+ MAP
+ REAL
+ SHORT
+ SMALLINT
+ STRUCT
+ TIME
+ TIMESTAMP\_LTZ
+ TIMESTAMP\_NTZ
+ TINYINT
+ VARCHAR

詳細については、*AWS Clean Rooms SQL リファレンス*の[「データ型](https://docs.aws.amazon.com/clean-rooms/latest/sql-reference/s_Supported_data_types.html)」を参照してください。

## のファイル圧縮タイプ AWS Clean Rooms
<a name="compression-types"></a>

ストレージスペースの縮小、パフォーマンスの向上、コストの最小化を行うため、データセットを圧縮することを強くお勧めします。

AWS Clean Rooms は、ファイル拡張子に基づいてファイル圧縮タイプを認識し、次の表に示す圧縮タイプと拡張子をサポートします。


| 圧縮アルゴリズム  | ファイル拡張子  | 
| --- | --- | 
| GZIP | .gz  | 
| Bzip2 | .bz2  | 
| Snappy | .snappy | 

さまざまなレベルで圧縮を適用できます。通常、ファイル全体を圧縮するか、ファイル内の個々のブロックを圧縮します。ファイルレベルで列形式を圧縮しても、パフォーマンス上の利点はありません。

## のサーバー側の暗号化 AWS Clean Rooms
<a name="server-side-encryption"></a>

**注記**  
暗号化コンピューティングを必要とするユースケースで、サーバー側の暗号化が代わりの役割を果たすことはありません。

AWS Clean Rooms は、次の暗号化オプションを使用して暗号化されたデータセットを透過的に復号します。
+ **SSE-S3** – Amazon S3 によって管理される AES-256 暗号化キーを使用したサーバー側暗号化。
+ **SSE-KMS** – によって管理されるキーによるサーバー側の暗号化 AWS Key Management Service 

SSE-S3 を使用するには、設定済みテーブルをコラボレーションに関連付けるために使用される AWS Clean Rooms サービスロールに KMS 復号アクセス許可が必要です。SSE-KMS を使用するには、KMS キーポリシーで AWS Clean Rooms サービスロールの復号も許可する必要があります。

AWS Clean Rooms は Amazon S3 クライアント側の暗号化をサポートしていません。サーバー側の暗号化の詳細については、「Amazon Simple Storage Service ユーザーガイド」の「[サーバー側の暗号化によるデータの保護](https://docs.aws.amazon.com/AmazonS3/latest/userguide/serv-side-encryption.html)」を参照してください。**