

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# トレーニングデータセットとテストデータセットの作成
<a name="creating-datasets"></a>



データセットとは、イメージとそのイメージを説明するラベルの集合のことです。プロジェクトには、トレーニングデータセットとテストデータセットが必要です。Amazon Rekognition Custom Labels は、トレーニングデータセットを使用してモデルをトレーニングします。Amazon Rekognition Custom Labels は、トレーニング後にテストデータセットを使用して、トレーニングされたモデルがどの程度正しいラベルを予測できるかを検証します。

Amazon Rekognition Custom Labels コンソールまたは AWS SDK を使用してデータセットを作成できます。データセットを作成する前に、「[Amazon Rekognition Custom Labels について](understanding-custom-labels.md)」を参照することを推奨します。そのほかのデータセットタスクについては、「[データセットの管理](managing-dataset.md)」を参照してください。

プロジェクトのトレーニングデータセットとテストデータセットを作成するステップは次のとおりです。

**プロジェクト用のトレーニングデータセットとテストデータセットを作成するには**

1. トレーニングデータセットとテストデータセットに対し、どのようなラベル付けが必要かを判断します。詳細については、「[データセットの目的の設定](md-dataset-purpose.md)」を参照してください。

1. トレーニングデータセットとテストデータセットのイメージを収集します。詳細については、「[イメージの準備](md-prepare-images.md)」を参照してください。

1. トレーニングデータセットとテストデータセットを作成します。詳細については、「[イメージ付きのトレーニングデータセットとテストデータセットの作成](md-create-dataset.md)」を参照してください。 AWS SDK を使用している場合は、「」を参照してください[トレーニングデータセットとテストデータセットの作成 (SDK)](md-create-dataset.md#cd-create-dataset-sdk)。

1. 必要に応じて、データセットのイメージにイメージレベルのラベルや境界ボックスを追加します。詳細については、「[イメージにラベルを付ける](md-labeling-images.md)」を参照してください。

データセットを作成すると、モデルを[トレーニング](training-model.md)できます。

**Topics**
+ [データセットの目的の設定](md-dataset-purpose.md)
+ [イメージの準備](md-prepare-images.md)
+ [イメージ付きのトレーニングデータセットとテストデータセットの作成](md-create-dataset.md)
+ [イメージにラベルを付ける](md-labeling-images.md)
+ [データセットのデバッグ](debugging-datasets.md)