本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
評估您的訓練模型
評估配方是一種 YAML 組態檔案,可定義 Amazon Nova 模型評估任務的執行方式。使用此配方,您可以根據常見的基準或您自己的自訂資料集,來評估基礎或訓練模型的效能。指標可以存放在 Amazon S3 或 TensorBoard 中。評估會提供量化指標,協助您評估各種任務的模型效能,以判斷是否需要進一步自訂。
模型評估是一種離線程序,在程序中會根據具有預先定義的回答測試模型。系統不會即時或根據即時使用者互動來評估它們。對於即時評估,將模型部署到 Amazon Bedrock 之後,您可以透過呼叫 Amazon Bedrock 執行時期 API 來評估模型。