本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
模型評估筆記本教學課程
本節提供下列筆記本教學課程,其中包含範例程式碼和說明:
-
如何針對提示刻板印象評估 JumpStart 模型。
-
如何針對文字摘要準確性評估 Amazon Bedrock 模型。
其他筆記本
fmeval GitHub
-
bedrock-claude-factual-knowledge.ipnyb
- 針對事實知識評估 Amazon Bedrock 上託管的 Anthropic Claude 2 模型。 -
byo-model-outputs.ipynb
- 針對事實知識評估 JumpStart 上託管的 Falcon 7b 模型 ,其中您自帶模型輸出,而不是將推論請求傳送至您的模型。 -
custom_model_runner_chat_gpt.ipnyb
- 針對事實知識評估 Hugging Face上託管的自訂ChatGPT 3.5模型。