使用 Amazon SageMaker AI 自訂模型 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon SageMaker AI 自訂模型

Amazon SageMaker AI 模型自訂是一項功能,可將傳統上複雜且耗時的 AI 模型自訂程序,從長達數月的工作轉換為可在數天內完成的簡化工作流程。此功能可解決 AI 開發人員面臨的關鍵挑戰,這些開發人員需要使用專屬資料自訂基礎模型,以建立高度差異化的客戶體驗。本 SageMaker AI 指南提供詳細的自訂文件,包括step-by-step指南和進階組態選項。如需 Nova 模型自訂的簡短概觀,請參閱《Amazon Nova 使用者指南》中的使用 SageMaker 自訂和微調

該功能包括新的引導式使用者介面,可了解自然語言需求,並具有一套完整的進階模型自訂技術,所有技術均採用無伺服器基礎設施,可消除管理運算資源的操作開銷。無論您是建置法律研究應用程式、增強客戶服務聊天機器人,還是開發特定領域的 AI 代理器,此功能都能加速從proof-of-concept到生產部署的路徑。

採用 Amazon Bedrock Evaluations 技術的模型自訂功能可能會在您的地理位置 AWS 區域 內安全地傳輸資料以進行處理。如需詳細資訊,請存取 Amazon Bedrock 評估文件

重要概念

無伺服器訓練

全受管的運算基礎設施,可消除所有基礎設施的複雜性,讓您僅專注於模型開發。這包括根據模型大小和訓練需求自動佈建 GPU 執行個體 (P5、P4de, P4d, G5)、納入每種自訂技術最佳實務的預先最佳化訓練配方、使用可透過 UI 存取的即時指標和日誌進行即時監控,以及在訓練完成後自動清理資源以最佳化成本。

模型自訂技術

完整的進階方法集,包括監督式微調 (SFT)、直接偏好最佳化 (DPO)、具有可驗證獎勵的強化學習 (RLVR),以及具有 AI 意見回饋的強化學習 (RLAIF)。

自訂模型

基礎模型的特殊版本,已根據自己的資料進行訓練,以適應特定使用案例,因此 AI 模型會保留原始基礎模型的一般功能,同時新增專為您的需求量身打造的領域特定知識、術語、風格或行為。

AI 模型自訂資產

用於在模型自訂程序期間訓練、精簡和評估自訂模型的資源和成品。這些資產包括資料集、 是訓練範例的集合 (prompt-response 對、 網域特定文字、 或標籤資料) 用於微調基礎模型,以學習特定行為, 知識、 或 樣式 和評估者 這些機制可透過任一獎勵函數來評估和改善模型效能 (以程式碼為基礎的邏輯,可根據特定條件對模型輸出進行評分, 用於 RLVR 訓練和自訂評分器評估) 或獎勵提示 (引導 LLM 判斷模型回應品質的自然語言指示, 用於 RLAIF 訓練和 LLM-as-a-judge 評估)。

模型套件群組

一種集合容器,可從訓練任務追蹤所有記錄的模型,為模型版本及其歷程提供集中位置。

已記錄的模型

執行無伺服器訓練任務時SageMaker AI 建立的輸出。這可以是微調的模型 (成功任務)、檢查點 (使用檢查點失敗的任務) 或相關聯的中繼資料 (沒有檢查點的失敗任務)。

已註冊的模型

已標記為正式追蹤和管理目的的記錄模型,可實現完整的歷程和生命週期管理。

譜系

會自動擷取訓練任務、輸入資料集、輸出模型、評估任務和跨 SageMaker AI 和 Amazon Bedrock 部署之間的關係。

跨帳戶共用

能夠使用 AWS Resource Access Manager (RAM) 跨 AWS 帳戶共用模型、資料集和評估器,同時保持完整的歷程可見性。