Entraînement itératif - Amazon Nova

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Entraînement itératif

La formation itérative est une approche systématique visant à affiner les modèles au moyen de plusieurs cycles de formation, au cours desquels chaque cycle s'appuie sur le point de contrôle précédent en corrigeant les faiblesses spécifiques découvertes lors de l'évaluation. Cette méthode permet d'améliorer de manière ciblée les performances des modèles en incorporant des exemples sélectionnés qui traitent des modes de défaillance, en s'adaptant aux exigences changeantes et en validant les améliorations de manière progressive plutôt que de s'engager dans un seul long cycle de formation. Le processus suit généralement des modèles tels que le SFT (Supervised Fine-Tuning) suivi du RFT (Reward-based Fine-Tuning), avec des points de contrôle stockés dans des compartiments S3 séquestres AWS gérés qui peuvent être référencés pour les itérations d'entraînement suivantes tout en maintenant la cohérence du type de modèle et de la technique d'entraînement tout au long du pipeline.

Pour plus d'informations, consultez Entraînement itératif.