Classification de texte pour l’évaluation des modèles dans Amazon Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Classification de texte pour l’évaluation des modèles dans Amazon Bedrock

La classification de texte sert à classer le texte dans des catégories prédéfinies. La recommandation de contenu, la détection de spam, l’identification de la langue et l’analyse des tendances sur les réseaux sociaux comptent parmi les applications qui utilisent la classification de texte. Les classes déséquilibrées, les données ambiguës, les données bruyantes et le biais d’étiquetage sont quelques-uns des problèmes qui peuvent entraîner des erreurs dans la classification de texte.

Important

En ce qui concerne la classification, un problème système connu empêche les modèles Cohere de mener à bien une évaluation de toxicité.

Avec les tâches de type classification de texte, il est recommandé d’utiliser les jeux de données intégrés suivants.

Women’s E-Commerce Clothing Reviews

Women’s E-Commerce Clothing Reviews est un jeu de données qui contient les avis de clientes sur des articles vestimentaires. Ce jeu de données est utilisé dans les tâches de classification de texte.

Le tableau suivant offre un résumé des métriques calculées et des jeux de données intégrés recommandés. Pour spécifier correctement les jeux de données intégrés disponibles à l’aide de l’AWS CLI ou d’un kit AWS SDK pris en charge, utilisez les noms des paramètres dans la colonne Jeux de données intégrés (API).

Jeux de données intégrés disponibles dans Amazon Bedrock
Type de tâche Métrique Jeux de données intégrés (console) Jeux de données intégrés (API) Métrique calculée
Classification de texte Précision Women’s Ecommerce Clothing Reviews Builtin.WomensEcommerceClothingBoolQ

Précision (précision binaire résultant de classification_accuracy_score)

Robustesse Women’s Ecommerce Clothing Reviews Builtin.WomensEcommerceClothingBoolQ

classification_accuracy_score et delta_classification_accuracy_score

Pour en savoir plus sur le mode de calcul de la métrique pour chaque jeu de données intégré, consultez Examen des rapports et des métriques des tâches d’évaluation de modèles dans Amazon Bedrock