Classificazione del testo per la valutazione del modello in Amazon Bedrock
La classificazione del testo viene utilizzata per suddividere il testo in categorie predefinite. Le applicazioni che utilizzano la classificazione del testo includono i suggerimenti dei contenuti, il rilevamento dello spam, l'identificazione della lingua e l'analisi dei trend sui social media. Classi sbilanciate, dati ambigui, dati confusi e bias nell'etichettatura sono alcuni dei problemi che possono causare errori nella classificazione del testo.
Importante
Per quanto riguarda la classificazione del testo, esiste un problema di sistema noto che impedisce ai modelli Cohere di completare con successo la valutazione della tossicità.
I seguenti set di dati integrati sono consigliati per l'uso con il tipo di attività classificazione del testo.
- Women's E-Commerce Clothing Reviews
-
Women's E-Commerce Clothing Reviews è un set di dati che contiene recensioni di abbigliamento scritte dai clienti. Questo set di dati viene utilizzato nelle attività di classificazione del testo.
La tabella seguente riepiloga le metriche calcolate e i set di dati integrati consigliati. Per specificare correttamente i set di dati integrati disponibili utilizzando la AWS CLI o un SDK AWS supportato, utilizza i nomi dei parametri nella colonna Set di dati integrati (API).
| Tipo di attività | Metrica | Set di dati integrati (console) | Set di dati integrati (API) | Metrica calcolata |
|---|---|---|---|---|
| Classificazione del testo | Accuratezza | Women's Ecommerce Clothing Reviews |
Builtin.WomensEcommerceClothingBoolQ |
Accuratezza (accuratezza binaria da classification_accuracy_score) |
| Robustezza | Women's Ecommerce Clothing Reviews |
Builtin.WomensEcommerceClothingBoolQ |
classification_accuracy_score e delta_classification_accuracy_score |
Per ulteriori informazioni su come viene calcolata la metrica per ogni set di dati integrato, consulta Analisi dei report e delle metriche relativi ai processi di valutazione del modello in Amazon Bedrock