反覆訓練

反覆訓練是一種系統化方法，可透過多個訓練週期微調模型，其中每個回合都是以先前的檢查點為基礎，方法是解決透過評估發現的特定弱點。此方法透過整合處理失敗模式、適應不斷變化的需求，以及逐步驗證增強功能，而不是遞交單一長訓練執行，來實現有針對性的改善，以建立效能模型。程序通常會遵循諸如 SFT （監督式微調）和 RFT （以獎勵為基礎的微調）等模式，其中包含存放受 AWS管託管 S3 儲存貯體的檢查點，可用於後續訓練反覆運算，同時在整個管道中保持模型類型和訓練技術的一致性。

如需更多詳細資訊，請參閱反覆訓練。

您的瀏覽器已停用或無法使用 Javascript。