

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Clean Rooms ML のトレーニングデータ要件
<a name="ml-training-data-requirements"></a>

類似モデルを正常に作成するには、トレーニングデータが次の要件を満たしている必要があります。
+ トレーニングデータは、Parquet、CSV、または JSON 形式である必要があります。
**注記**  
Zstandard (ZSTD) 圧縮 Parquet データはサポートされていません。
+ トレーニングデータはカタログ化する必要があります AWS Glue。詳細については、 AWS Glue デベロッパーガイド[のAWS Glue データカタログの開始方法](https://docs.aws.amazon.com//glue/latest/dg/start-data-catalog.html)」を参照してください。スキーマは自動的に推測されるため、 AWS Glue クローラを使用してテーブルを作成することをお勧めします。
+ トレーニングデータとシードデータを含む Amazon S3 バケットは、他の Clean Rooms ML リソースと同じ AWS リージョンにあります。
+ トレーニングデータには、少なくとも 100,000 個の一意のユーザー ID が含まれ、それぞれに少なくとも 2 つのアイテムインタラクションが含まれている必要があります。
+ トレーニングデータには、少なくとも 100 万個のレコードが含まれている必要があります。
+ [CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html) アクションで指定されたスキーマは、 AWS Glue テーブルの作成時に定義されたスキーマと一致する必要があります。
+ 指定されたテーブルで定義されている必須フィールドは、[CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html) アクションで定義されます。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/clean-rooms/latest/userguide/ml-training-data-requirements.html)
+ オプションで、最大 10 個のカテゴリ特徴量または数値特徴量を指定できます。

CSV 形式の有効なトレーニングデータセットの例を次に示します。

```
USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE(CATEGORICAL FEATURE),EVENT_VALUE (NUMERICAL FEATURE)
196,242,881250949,click,15
186,302,891717742,click,13
22,377,878887116,click,10
244,51,880606923,click,20
166,346,886397596,click,10
```