評估您的自訂訓練任務 - Amazon Nova

評估您的自訂訓練任務

評估配方是一個 YAML 組態檔案,定義了 Amazon Nova 模型評估任務的執行方式。使用此配方,您可以根據常見基準或您自己的自訂資料集來評估基礎模型或訓練模型的效能。指標可以儲存在 Amazon S3 或 TensorBoard 中。評估提供量化指標,協助您評估模型在各種任務中的效能,判斷是否需要進一步自訂。

模型評估是一個離線程序,期間會根據具有預先定義答案的固定基準對模型進行測試。它們不會以即時方式或針對即時使用者互動進行評估。要進行即時評估,您可以透過呼叫 Amazon Bedrock 執行時期 API,在模型部署到 Amazon Bedrock 之後對其進行評估。

如需評估您的 Amazon Nova 訓練模型的詳細説明,請參閱《SageMaker 使用者指南》中的評估訓練模型一節。