Entrenamiento iterativo - Amazon Nova

Entrenamiento iterativo

El entrenamiento iterativo es un enfoque sistemático para refinar los modelos mediante varios ciclos de entrenamiento, en los que cada ronda se basa en el punto de control anterior y aborda las debilidades específicas detectadas en la evaluación. Este método permite introducir mejoras específicas en el rendimiento de los modelos mediante la incorporación de ejemplos seleccionados que abordan los modos de error, la adaptación a los requisitos cambiantes y la validación de las mejoras de forma gradual, en lugar de tener que llevar a cabo una sola sesión de entrenamiento de larga duración. Por lo general, el proceso sigue patrones como el refinamiento supervisado (SFT) seguido del RFT (refinamiento basado en recompensas), con puntos de control almacenados en buckets de S3 de custodia administrados por AWS a los que se puede hacer referencia en las siguientes iteraciones de entrenamiento, todo esto usando el mismo tipo de modelo y técnica de entrenamiento para no perder la coherencia a lo largo del proceso.

Para obtener más detalles, consulte Entrenamiento iterativo.