

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Creación de conjuntos de datos de entrenamiento y prueba
<a name="md-create-dataset"></a>

Puede empezar con un proyecto que tenga un único conjunto de datos o un proyecto que tenga conjuntos de datos de entrenamiento y de prueba independientes. Si empieza con un único conjunto de datos, Etiquetas personalizadas de Amazon Rekognition lo divide durante el entrenamiento para crear un conjunto de datos de entrenamiento (80 %) y un conjunto de datos de prueba (20 %) para su proyecto. Comience con un único conjunto de datos si quiere que Etiquetas personalizadas de Amazon Rekognition decida dónde se utilizan las imágenes para el entrenamiento y las pruebas. Para tener un control total sobre el entrenamiento, las pruebas y el nivel de rendimiento, le recomendamos que inicie el proyecto con conjuntos de datos de entrenamiento y prueba independientes. 

Puede crear conjuntos de datos de entrenamiento y prueba para un proyecto importando imágenes a través de una de las siguientes ubicaciones:
+ [Importar imágenes desde un bucket de Amazon S3](md-create-dataset-s3.md)
+ [Importar imágenes desde un ordenador local](md-create-dataset-computer.md)
+ [Utilizar un archivo de manifiesto para importar imágenes](md-create-dataset-ground-truth.md)
+ [Copia de contenido de un conjunto de datos existente](md-create-dataset-existing-dataset.md)

Si comienza su proyecto con conjuntos de datos de entrenamiento y prueba separados, podrá usar diferentes ubicaciones de origen para cada conjunto de datos.

Según el lugar desde el que importe las imágenes, es posible que no estén etiquetadas. Por ejemplo, las imágenes importadas de un ordenador local no están etiquetadas. Las imágenes importadas de un archivo de manifiesto de Amazon SageMaker AI Ground Truth están etiquetadas. Puede utilizar la consola de Etiquetas personalizadas de Amazon Rekognition para agregar, cambiar y asignar etiquetas. Para obtener más información, consulte [Etiquetado de imágenes](md-labeling-images.md).

Si las imágenes se cargan con errores, faltan imágenes o faltan etiquetas en las imágenes, lea [Depuración de un modelo de entrenamiento con errores](tm-debugging.md).

Para obtener más información sobre los conjuntos de datos, consulte [Administración de conjuntos de datos](managing-dataset.md).

## Crear conjuntos de datos de entrenamiento y prueba (SDK)
<a name="cd-create-dataset-sdk"></a>

Puede usar el AWS SDK para crear conjuntos de datos de entrenamiento y prueba.

La operación `CreateDataset` le permite especificar etiquetas de forma opcional al crear un nuevo conjunto de datos con el fin de categorizar y administrar sus recursos. 

### Conjunto de datos de entrenamiento
<a name="cd-create-training-dataset"></a>

Puedes usar el AWS SDK para crear un conjunto de datos de entrenamiento de las siguientes maneras.
+ [CreateDataset](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_CreateDataset)Utilícelo con un archivo de manifiesto en formato Amazon Sagemaker que proporcione. Para obtener más información, consulte [Creación de un archivo de manifiesto](md-create-manifest-file.md). Para ver el código de ejemplo, consulte [Creación de un conjunto de datos con un archivo de manifiesto (SDK) de SageMaker AI Ground Truth](md-create-dataset-ground-truth.md#md-create-dataset-ground-truth-sdk).
+ Use `CreateDataset` para copiar un conjunto de datos existente de Etiquetas personalizadas de Amazon Rekognition. Para ver el código de ejemplo, consulte [Creación de un conjunto de datos mediante un conjunto de datos existente (SDK)](md-create-dataset-existing-dataset-sdk.md).
+ Cree un conjunto de datos vacío con `CreateDataset` y agregue entradas del conjunto de datos más adelante con [UpdateDatasetEntries](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_UpdateDatasetEntries). Para crear un conjunto de datos vacío, consulte [Agregar un conjunto de datos a un proyecto](md-add-dataset.md). Para agregar imágenes a un conjunto de datos, consulte [Agregar más imágenes (SDK)](md-add-images.md#md-add-images-sdk). Debe agregar las entradas del conjunto de datos antes de poder entrenar un modelo.

### Conjunto de datos de prueba
<a name="cd-create-test-dataset"></a>

Puede usar el AWS SDK para crear un conjunto de datos de prueba de las siguientes maneras:
+ [CreateDataset](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_CreateDataset)Utilícelo con un archivo de manifiesto en formato Amazon Sagemaker que proporcione. Para obtener más información, consulte [Creación de un archivo de manifiesto](md-create-manifest-file.md). Para ver el código de ejemplo, consulte [Creación de un conjunto de datos con un archivo de manifiesto (SDK) de SageMaker AI Ground Truth](md-create-dataset-ground-truth.md#md-create-dataset-ground-truth-sdk).
+ Use `CreateDataset` para copiar un conjunto de datos existente de Etiquetas personalizadas de Amazon Rekognition. Para ver el código de ejemplo, consulte [Creación de un conjunto de datos mediante un conjunto de datos existente (SDK)](md-create-dataset-existing-dataset-sdk.md).
+ Cree un conjunto de datos vacío con `CreateDataset` y agregue entradas del conjunto de datos más adelante con `UpdateDatasetEntries`. Para crear un conjunto de datos vacío, consulte [Agregar un conjunto de datos a un proyecto](md-add-dataset.md). Para agregar imágenes a un conjunto de datos, consulte [Agregar más imágenes (SDK)](md-add-images.md#md-add-images-sdk). Debe agregar las entradas del conjunto de datos antes de poder entrenar un modelo.
+ Divida el conjunto de datos de entrenamiento en conjuntos de datos de entrenamiento y prueba independientes. En primer lugar, cree un conjunto de datos de prueba vacío con `CreateDataset`. A continuación, mueva el 20% de las entradas del conjunto de datos de entrenamiento al conjunto de datos de prueba mediante una llamada [DistributeDatasetEntries](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_DistributeDatasetEntries). Para crear un conjunto de datos vacío, consulte [Agregar un conjunto de datos a un proyecto (SDK)](md-add-dataset.md#md-add-dataset-sdk). Para dividir el conjunto de datos de entrenamiento, consulte [Distribución de un conjunto de datos de entrenamiento (SDK)](md-distributing-datasets.md).