Entraînement itératif

La formation itérative est une approche systématique visant à affiner les modèles au moyen de plusieurs cycles de formation, au cours desquels chaque cycle s'appuie sur le point de contrôle précédent en corrigeant les faiblesses spécifiques découvertes lors de l'évaluation. Cette méthode permet d'améliorer de manière ciblée les performances des modèles en incorporant des exemples sélectionnés qui traitent des modes de défaillance, en s'adaptant aux exigences changeantes et en validant les améliorations de manière progressive plutôt que de s'engager dans un seul long cycle de formation. Le processus suit généralement des modèles tels que le SFT (Supervised Fine-Tuning) suivi du RFT (Reward-based Fine-Tuning), avec des points de contrôle stockés dans des compartiments S3 séquestres AWS gérés qui peuvent être référencés pour les itérations d'entraînement suivantes tout en maintenant la cohérence du type de modèle et de la technique d'entraînement tout au long du pipeline.

Pour plus d'informations, consultez Entraînement itératif.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Évaluation

Sur SageMaker HyperPod