監督式微調 (完整 FT、PEFT)
監督式微調 (SFT) 是將提示詞-回應配對集合提供給基礎模型,以改善特定任務的預先訓練基礎模型效能的過程。帶有標籤的範例格式為提示-回應配對,並以指令的形式表述。此微調程序會改變模型的權重。
當您的特定領域資料需要提供特定提示詞-回應配對,以獲得最佳結果時,您應該使用 SFT。全秩 SFT 和參數高效 SFT 皆可使用。
如需搭配 Amazon Nova 模型自訂使用 SFT 的詳細說明,請參閱《SageMaker 使用者指南》中的監督式微調 (完整 FT、PEFT) 一節。