

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 创建训练和测试数据集
<a name="creating-datasets"></a>



数据集是由图像和描述这些图像的标签组成的集合。项目需要一个训练数据集和一个测试数据集。Amazon Rekognition Custom Labels 使用训练数据集来训练模型。训练结束后，Amazon Rekognition Custom Labels 会使用测试数据集来验证训练后的模型预测正确标签的效果。

您可以使用 Amazon Rekognition 自定义标签控制台或软件开发工具包创建数据集。 AWS 在创建数据集之前，建议先阅读[了解 Amazon Rekognition Custom Labels](understanding-custom-labels.md)。有关其他数据集任务，请参阅[管理数据集](managing-dataset.md)。

为项目创建训练和测试数据集的步骤如下：

**为项目创建训练和测试数据集**

1. 确定需要如何标注训练和测试数据集。有关更多信息，请参阅 [确定数据集用途](md-dataset-purpose.md)。

1. 为训练和测试数据集收集图像。有关更多信息，请参阅 [准备图像](md-prepare-images.md)。

1. 创建训练和测试数据集。有关更多信息，请参阅 [使用图像创建训练和测试数据集](md-create-dataset.md)。如果您使用的是 AWS SDK，请参阅[创建训练和测试数据集 (SDK)](md-create-dataset.md#cd-create-dataset-sdk)。

1. 如有必要，可以向数据集图像添加图像级标签或边界框。有关更多信息，请参阅 [标注图像](md-labeling-images.md)。

创建数据集后，即可[训练](training-model.md)模型。

**Topics**
+ [确定数据集用途](md-dataset-purpose.md)
+ [准备图像](md-prepare-images.md)
+ [使用图像创建训练和测试数据集](md-create-dataset.md)
+ [标注图像](md-labeling-images.md)
+ [调试数据集](debugging-datasets.md)