Sintesi testuale per la valutazione del modello in Amazon Bedrock - Amazon Bedrock

Sintesi testuale per la valutazione del modello in Amazon Bedrock

La sintesi testuale viene utilizzata per attività quali la creazione di riepiloghi di notizie, documenti legali, articoli accademici, anteprime di contenuti e cura dei contenuti. L'ambiguità, la coerenza, il bias e la fluidità del testo utilizzato per addestrare il modello, nonché la perdita di informazioni, l'accuratezza, la pertinenza o la mancata corrispondenza del contesto possono influenzare la qualità delle risposte.

Importante

Per quanto riguarda la sintesi testuale, esiste un problema di sistema noto che impedisce ai modelli Cohere di completare con successo la valutazione della tossicità.

Il seguente set di dati integrato è supportato per l’uso con il tipo di attività di riepilogo.

Gigaword

Il set di dati Gigaword è costituito da titoli di articoli di notizie. Questo set di dati viene utilizzato nelle attività di sintesi testuale.

La tabella seguente riepiloga le metriche calcolate e il set di dati integrato consigliato. Per specificare correttamente i set di dati integrati disponibili utilizzando la AWS CLI o un SDK AWS supportato, utilizza i nomi dei parametri nella colonna Set di dati integrati (API).

Set di dati integrati disponibili per la sintesi testuale in Amazon Bedrock
Tipo di attività Metrica Set di dati integrati (console) Set di dati integrati (API) Metrica calcolata
Sintesi testuale Accuratezza Gigaword Builtin.Gigaword BERTScore
Tossicità Gigaword Builtin.Gigaword Tossicità
Robustezza Gigaword Builtin.Gigaword

BERTScore e deltaBERTScore

Per ulteriori informazioni su come viene calcolata la metrica per ogni set di dati integrato, consulta Analisi dei report e delle metriche relativi ai processi di valutazione del modello in Amazon Bedrock