

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 模型即評判評估任務的內建指標評估工具提示
<a name="model-evaluation-type-judge-prompt"></a>

當您執行以評判為基礎的模型評估任務時，*評估工具模型*會根據您定義的一組指標來計算*產生器模型的*回應的分數。Amazon Bedrock 提供多種內建指標，或者您可以定義自己的[自訂指標](model-evaluation-custom-metrics-prompt-formats.md)。

請參閱下列各節，查看 Amazon Bedrock 內建指標的可用評估工具模型所使用的提示。

**Topics**
+ [Amazon Nova Pro](model-evaluation-type-judge-prompt-nova.md)
+ [Anthropic Claude 3.5 Sonnet](model-evaluation-type-judge-prompt-claude-sonnet.md)
+ [Anthropic Claude 3.5 Sonnet v2](model-evaluation-type-judge-prompt-claude-sonnet35v2.md)
+ [Anthropic Claude 3.7 Sonnet](model-evaluation-type-judge-prompt-claude-sonnet37.md)
+ [Anthropic Claude 3 Haiku](model-evaluation-type-judge-prompt-haiku.md)
+ [Anthropic Claude 3.5 Haiku](model-evaluation-type-judge-prompt-haiku35.md)
+ [Meta Llama 3.1 70B Instruct](model-evaluation-type-judge-prompt-llama.md)
+ [Mistral Large](model-evaluation-type-judge-prompt-mistral.md)