

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Création de jeux de données d’entraînement et de test avec des images
<a name="md-create-dataset"></a>

Vous pouvez commencer par un projet avec un seul jeu de données ou avec un jeu de données d’entraînement et un jeu de données de test distincts. Si vous commencez avec un seul jeu de données, Étiquettes personnalisées Amazon Rekognition fractionne le jeu de données pendant l’entraînement afin de créer un jeu de données d’entraînement (80 %) et un jeu de données de test (20 %) pour votre projet. Commencez par un seul jeu de données si vous souhaitez qu’Étiquettes personnalisées Amazon Rekognition détermine où les images sont utilisées pour l’entraînement et les tests. Pour un contrôle complet de l’entraînement, du test et du réglage des performances, nous vous recommandons de démarrer votre projet avec des jeux de données d’entraînement et de test distincts. 

Pour créer des jeux de données d’entraînement et de test pour un projet, vous pouvez importer des images depuis l’un des emplacements suivants :
+ [Importation d'images depuis un compartiment Amazon S3](md-create-dataset-s3.md)
+ [Importation d'images depuis un ordinateur local](md-create-dataset-computer.md)
+ [Utilisation d'un fichier manifeste pour importer des images](md-create-dataset-ground-truth.md)
+ [Copier le contenu d'un ensemble de données existant](md-create-dataset-existing-dataset.md)

Si vous démarrez votre projet avec un jeu de données d’entraînement et un jeu de données de test distincts, vous pouvez utiliser des emplacements source différents pour chacun d’eux.

Selon leur provenance, vos images peuvent ne pas être étiquetées. Par exemple, les images importées à partir d’un ordinateur local ne sont pas étiquetées. Les images importées depuis un fichier manifeste Amazon SageMaker AI Ground Truth sont étiquetées. Vous pouvez utiliser la console Étiquettes personnalisées Amazon Rekognition pour ajouter, modifier et attribuer des étiquettes. Pour plus d’informations, consultez [Étiquetage des images](md-labeling-images.md).

Si les images sont chargées avec des erreurs, si des images sont manquantes ou si des étiquettes sont absentes des images, lisez [Débogage d’un entraînement de modèle en échec](tm-debugging.md).

Pour plus d’informations sur les jeux de données, consultez [Gestion des jeux de données](managing-dataset.md).

## Création de jeux de données d’entraînement et de test (kit SDK)
<a name="cd-create-dataset-sdk"></a>

Vous pouvez utiliser le AWS SDK pour créer des ensembles de données d'entraînement et de test.

L'`CreateDataset`opération vous permet de spécifier éventuellement des balises lors de la création d'un nouvel ensemble de données, dans le but de catégoriser et de gérer vos ressources. 

### Jeu de données d’entraînement
<a name="cd-create-training-dataset"></a>

Vous pouvez utiliser le AWS SDK pour créer un ensemble de données d'entraînement de la manière suivante.
+ [CreateDataset](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_CreateDataset)À utiliser avec un fichier manifeste au format Amazon Sagemaker que vous fournissez. Pour de plus amples informations, veuillez consulter [Création d’un fichier manifeste](md-create-manifest-file.md). Pour obtenir un exemple de code, consultez [Création d'un ensemble de données à l'aide d'un fichier manifeste (SDK) SageMaker AI Ground Truth](md-create-dataset-ground-truth.md#md-create-dataset-ground-truth-sdk).
+ Utilisez `CreateDataset` pour copier un jeu de données Étiquettes personnalisées Amazon Rekognition existant. Pour obtenir un exemple de code, consultez [Création d’un jeu de données à partir d’un jeu de données existant (kit SDK)](md-create-dataset-existing-dataset-sdk.md).
+ Créez un jeu de données vide avec `CreateDataset`, puis ajoutez les entrées du jeu de données ultérieurement avec [UpdateDatasetEntries](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_UpdateDatasetEntries). Pour créer un jeu de données vide, consultez [Ajout d’un jeu de données à un projet](md-add-dataset.md). Pour ajouter des images à un jeu de données, consultez [Ajout d’autres images (kit SDK)](md-add-images.md#md-add-images-sdk). Vous devez ajouter les entrées du jeu de données avant de pouvoir entraîner un modèle.

### Jeu de données de test
<a name="cd-create-test-dataset"></a>

Vous pouvez utiliser le AWS SDK pour créer un ensemble de données de test de la manière suivante :
+ [CreateDataset](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_CreateDataset)À utiliser avec un fichier manifeste au format Amazon Sagemaker que vous fournissez. Pour de plus amples informations, veuillez consulter [Création d’un fichier manifeste](md-create-manifest-file.md). Pour obtenir un exemple de code, consultez [Création d'un ensemble de données à l'aide d'un fichier manifeste (SDK) SageMaker AI Ground Truth](md-create-dataset-ground-truth.md#md-create-dataset-ground-truth-sdk).
+ Utilisez `CreateDataset` pour copier un jeu de données Étiquettes personnalisées Amazon Rekognition existant. Pour obtenir un exemple de code, consultez [Création d’un jeu de données à partir d’un jeu de données existant (kit SDK)](md-create-dataset-existing-dataset-sdk.md).
+ Créez un jeu de données vide avec `CreateDataset`, puis ajoutez les entrées du jeu de données ultérieurement avec `UpdateDatasetEntries`. Pour créer un jeu de données vide, consultez [Ajout d’un jeu de données à un projet](md-add-dataset.md). Pour ajouter des images à un jeu de données, consultez [Ajout d’autres images (kit SDK)](md-add-images.md#md-add-images-sdk). Vous devez ajouter les entrées du jeu de données avant de pouvoir entraîner un modèle.
+ Fractionnez le jeu de données d’entraînement en un jeu de données d’entraînement et un jeu de données de test distincts. Créez d’abord un jeu de données de test vide avec `CreateDataset`. Déplacez ensuite 20 % des entrées du jeu de données d'entraînement dans le jeu de données de test en appelant [DistributeDatasetEntries](https://docs.aws.amazon.com/rekognition/latest/APIReference/API_DistributeDatasetEntries). Pour créer un jeu de données vide, consultez [Ajout d’un jeu de données à un projet (kit SDK)](md-add-dataset.md#md-add-dataset-sdk). Pour fractionner le jeu de données d’entraînement, consultez [Distribution d’un jeu de données d’entraînement (kit SDK)](md-distributing-datasets.md).