評估和比較 Amazon SageMaker JumpStart 文字分類模型 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

評估和比較 Amazon SageMaker JumpStart 文字分類模型

SageMaker AI JumpStart 提供多種文字分類模型,將文字分類為預先定義的類別。這些模型會處理情緒分析、主題分類和內容審核等任務。選擇正確的生產模型,需要使用金鑰指標進行仔細評估,包括準確性、F1-score 和馬修斯相關係數 (MCC)。

在本指南中,您可以:

  • 從 JumpStart 目錄部署多個文字分類模型 (DistilBERT 和 BERT)。

  • 跨平衡、偏斜和具有挑戰性資料集執行全面評估。

  • 解譯進階指標,包括馬修斯相關係數 (MCC) 和曲線下面積接收器操作特性分數。

  • 使用系統化比較架構做出資料驅動的模型選擇決策。

  • 使用自動擴展和 CloudWatch 監控來設定生產部署。

下載完整的評估架構:JumpStart 模型評估套件套件包含具有範例輸出的預先執行結果,因此您可以在自行部署模型之前預覽評估程序和指標。

先決條件

開始前,請確定您有下列項目:

時間和成本:總計 45 分鐘。成本會根據執行個體類型和使用持續時間而有所不同 - 如需目前費率,請參閱 SageMaker AI 定價

本教學課程包含逐步清除指示,協助您移除所有資源並避免持續收費。