Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Supervise su trabajo de formación en RFT
Durante el ajuste de los refuerzos, puede supervisar el progreso del entrenamiento en tiempo real mediante gráficos y métricas visuales en la consola de Amazon Bedrock. El panel de métricas de entrenamiento muestra los indicadores clave de rendimiento, como las puntuaciones de recompensa, las curvas de pérdidas y las mejoras de precisión a lo largo del tiempo. Estas métricas te ayudan a entender si el modelo converge correctamente y si la función de recompensa guía eficazmente el proceso de aprendizaje.
Métricas de entrenamiento en tiempo real
Amazon Bedrock proporciona supervisión en tiempo real durante el entrenamiento de RFT con gráficos visuales que muestran las métricas de entrenamiento y validación.
Métricas principales de entrenamiento
-
Pérdida de entrenamiento: mide qué tan bien aprende el modelo a partir de los datos de entrenamiento
-
Estadísticas de recompensas por entrenamiento: muestran las puntuaciones de recompensa asignadas por tus funciones de recompensa
-
Margen de recompensa: mide la diferencia entre las recompensas por respuestas buenas y malas
-
Precisión en los conjuntos de entrenamiento y validación: muestra el rendimiento del modelo tanto en los datos de entrenamiento como en los datos retenidos
Visualización del progreso del entrenamiento
La consola muestra gráficos interactivos que se actualizan en tiempo real a medida que avanza tu trabajo de RFT. Estas visualizaciones pueden ayudarle a:
-
Realice un seguimiento de la convergencia hacia un rendimiento óptimo
-
Identifique pronto los posibles problemas de formación
-
Determine los puntos de parada óptimos
-
Compare el rendimiento en diferentes épocas
Seguimiento del estado del trabajo
Supervise el estado de sus trabajos de RFT a través de la consola Amazon Bedrock.
Fases del trabajo:
-
Validación
-
Formación
Indicadores de finalización:
-
El estado del trabajo cambia a Completado cuando la formación se completa correctamente
-
El ARN del modelo personalizado pasa a estar disponible para su implementación
-
Las métricas de entrenamiento alcanzan los umbrales de convergencia