

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立培訓和測試資料集
<a name="creating-datasets"></a>



資料集指描述這些影像的一組影像和標籤。您的專案需要訓練資料集和測試資料集。Amazon Rekognition 自訂標籤會使用訓練資料集來訓練您的模型。訓練結束後，Amazon Rekognition 自訂標籤會使用測試資料集來驗證訓練過的模型預測正確標籤的成效。

您可以使用 Amazon Rekognition 自訂標籤主控台或 AWS SDK 建立資料集。建立資料集之前，我們建議您先閱讀 [了解 Amazon Rekognition 自訂標籤](understanding-custom-labels.md)。如需其他資料集任務，請參閱 [管理資料集](managing-dataset.md)。

為專案建立訓練和測試資料集的步驟如下：

**建立專案的訓練和測試資料集**

1. 確定您需要如何標記訓練和測試資料集。如需更多詳細資訊，[規劃資料集](md-dataset-purpose.md)。

1. 收集訓練和測試資料集的影像。如需詳細資訊，請參閱[準備影像](md-prepare-images.md)。

1. 建立訓練和測試資料集。如需詳細資訊，請參閱[建立包含影像的訓練和測試資料集](md-create-dataset.md)。如果您使用的是 AWS 開發套件，請參閱 [建立訓練和測試資料集 (SDK)](md-create-dataset.md#cd-create-dataset-sdk)。

1. 如有必要，請新增影像層級標籤或週框方塊至您的資料集影像。如需詳細資訊，請參閱[標記檔案](md-labeling-images.md)。

建立資料集之後，您即可[訓練](training-model.md)模型。

**Topics**
+ [規劃資料集](md-dataset-purpose.md)
+ [準備影像](md-prepare-images.md)
+ [建立包含影像的訓練和測試資料集](md-create-dataset.md)
+ [標記檔案](md-labeling-images.md)
+ [偵錯資料集](debugging-datasets.md)