

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Domanda e risposta per la valutazione del modello in Amazon Bedrock
<a name="model-evaluation-tasks-question-answer"></a>

Domanda e risposta vengono utilizzate per attività quali la generazione di risposte automatiche dall’help desk, il recupero di informazioni e l’e-learning. Se il testo utilizzato per addestrare il modello di fondazione contiene problemi quali dati incompleti o imprecisi, sarcasmo o ironia, la qualità delle risposte può peggiorare.

**Importante**  
Per domanda e risposta esiste un problema di sistema noto che impedisce ai modelli Cohere di completare con successo una valutazione della tossicità.

I seguenti set di dati integrati sono consigliati per l’uso con il tipo di attività domanda e risposta.

**BoolQ**  
BoolQ è un set di dati composto da coppie di yes/no domande e risposte. Il prompt contiene un breve brano e quindi una domanda sul brano. Questo set di dati è consigliato per l’uso con tipi di attività di domanda e risposta.

**Natural questions**  
Natural questions è un set di dati composto da domande reali degli utenti inviate alla ricerca Google.

**TriviaQA**  
TriviaQA è un set di dati che contiene oltre 650.000. question-answer-evidence-triples Questo set di dati viene utilizzato nelle attività di domanda e risposta.

La tabella seguente riepiloga le metriche calcolate e il set di dati integrato consigliato. *Per specificare correttamente i set di dati integrati disponibili utilizzando o un AWS SDK supportato AWS CLI, utilizza i nomi dei parametri nella colonna Set di dati integrati (API).*


**Set di dati integrati disponibili per il tipo di attività di domanda e risposta in Amazon Bedrock**  
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/it_it/bedrock/latest/userguide/model-evaluation-tasks-question-answer.html)

Per ulteriori informazioni su come viene calcolata la metrica per ogni set di dati integrato, consultare [Analisi dei report e delle metriche relativi ai processi di valutazione del modello in Amazon Bedrock](model-evaluation-report.md)