

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Testez les données d'entraînement
<a name="testing-the-model"></a>

Après avoir entraîné le modèle, Amazon Comprehend teste le modèle de classificateur personnalisé. Si vous ne fournissez pas de jeu de données de test, Amazon Comprehend entraîne le modèle avec 90 % des données de formation. Il réserve 10 % des données de formation à des fins de test. Si vous fournissez un ensemble de données de test, les données de test doivent inclure au moins un exemple pour chaque étiquette unique du jeu de données d'entraînement. 

Le test du modèle vous fournit des mesures que vous pouvez utiliser pour estimer la précision du modèle. La console affiche les métriques dans la section **Performances du classificateur** de la page de **détails du classificateur** de la console. Ils sont également renvoyés dans les `Metrics` champs renvoyés par l'[DescribeDocumentClassifier](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeDocumentClassifier.html)opération.

Dans les exemples de données de formation suivants, il existe cinq labels : DOCUMENTARY, DOCUMENTARY, SCIENCE\$1FICTION, DOCUMENTARY, ROMANTIC\$1COMEDY. Il existe trois catégories uniques : DOCUMENTAIRE, SCIENCE\$1FICTION, COMÉDIE ROMANTIQUE. 


| Colonne 1 | Colonne 2 | 
| --- | --- | 
| DOCUMENTAIRE | texte du document 1 | 
| DOCUMENTAIRE | texte du document 2 | 
| SCIENCE-FICTION | texte du document 3 | 
| DOCUMENTAIRE | texte du document 4 | 
| COMÉDIE ROMANTIQUE | texte du document 5 | 

Pour le fractionnement automatique (où Amazon Comprehend réserve 10 % des données de formation à utiliser pour les tests), si les données d'entraînement contiennent un nombre limité d'exemples d'une étiquette spécifique, le jeu de données de test peut ne contenir aucun exemple de cette étiquette. Par exemple, si le jeu de données d'entraînement contient 1 000 instances de la classe DOCUMENTARY, 900 instances de SCIENCE\$1FICTION et une seule instance de la classe ROMANTIC\$1COMEDY, le jeu de données de test peut contenir 100 instances DOCUMENTARY et 90 instances SCIENCE\$1FICTION, mais aucune instance ROMANTIC\$1COMEDY, car un seul exemple est disponible. 

Une fois que vous avez terminé l'entraînement de votre modèle, les métriques d'entraînement fournissent des informations que vous pouvez utiliser pour déterminer si le modèle est suffisamment précis pour vos besoins. 