反覆訓練 - Amazon Nova

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

反覆訓練

反覆訓練是一種系統性方法,可透過多個訓練週期微調模型,其中每個回合都是以先前的檢查點為基礎,方法是解決透過評估發現的特定弱點。此方法透過整合處理失敗模式、適應不斷變化的需求,以及逐步驗證增強功能,而不是遞交單一長訓練執行,來實現有針對性的改善,以建立效能模型。程序通常會遵循諸如 SFT (監督式微調) 和 RFT (以獎勵為基礎的微調) 等模式,其中包含存放受 AWS管託管 S3 儲存貯體的檢查點,可用於後續訓練反覆運算,同時在整個管道中保持模型類型和訓練技術的一致性。

如需更多詳細資訊,請參閱 反覆訓練