

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 評估您的訓練模型
<a name="nova-hp-evaluate"></a>

評估配方是一種 YAML 組態檔案，可定義 Amazon Nova 模型評估任務的執行方式。使用此配方，您可以根據常見的基準或您自己的自訂資料集，來評估基礎或訓練模型的效能。指標可以存放在 Amazon S3 或 TensorBoard 中。評估會提供量化指標，協助您評估各種任務的模型效能，以判斷是否需要進一步自訂。

模型評估是一種離線程序，在程序中會根據具有預先定義的回答測試模型。系統不會即時或根據即時使用者互動來評估它們。對於即時評估，將模型部署到 Amazon Bedrock 之後，您可以透過呼叫 Amazon Bedrock 執行時期 API 來評估模型。

**重要**  
評估容器僅支援相同訓練平台產生的檢查點。使用 SageMaker HyperPod 建立的檢查點只能使用 SageMaker HyperPod 評估工作流程進行評估，而使用 SageMaker 訓練任務建立的檢查點只能使用 SageMaker 訓練任務評估工作流程進行評估。嘗試從不同平台評估檢查點會導致失敗。

**Topics**
+ [可用的基準任務](customize-fine-tune-evaluate-available-tasks.md)
+ [了解配方參數](customize-fine-tune-evaluate-understand-modify.md)
+ [評估配方範例](customize-fine-tune-evaluate-recipe-examples.md)
+ [啟動評估任務](customize-fine-tune-evaluate-start-job.md)
+ [存取和分析評估結果](customize-fine-tune-evaluate-access-results.md)