Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Surveillez votre travail de formation RFT
Pendant le réglage précis du renforcement, vous pouvez suivre la progression de l'entraînement en temps réel à l'aide de graphiques visuels et de mesures dans la console Amazon Bedrock. Le tableau de bord des indicateurs d'entraînement affiche les indicateurs de performance clés, notamment les scores de récompense, les courbes de pertes et les améliorations de précision au fil du temps. Ces indicateurs vous aident à comprendre si le modèle converge correctement et si la fonction de récompense guide efficacement le processus d'apprentissage.
Indicateurs d'entraînement en temps réel
Amazon Bedrock fournit une surveillance en temps réel pendant la formation RFT avec des graphiques visuels affichant les mesures de formation et de validation.
Principaux indicateurs d'entraînement
-
Perte d'entraînement : mesure dans quelle mesure le modèle apprend à partir des données d'entraînement
-
Statistiques sur les récompenses d'entraînement - Affiche les scores de récompenses attribués par vos fonctions de récompense
-
Marge de récompense : mesure la différence entre les récompenses pour bonnes et mauvaises réponses
-
Précision des ensembles d'entraînement et de validation : affiche les performances du modèle à la fois sur les données d'entraînement et sur les données maintenues
Visualisation des progrès de l'entraînement
La console affiche des graphiques interactifs qui sont mis à jour en temps réel à mesure que votre tâche RFT progresse. Ces visualisations peuvent vous aider à :
-
Suivez la convergence vers des performances optimales
-
Identifiez rapidement les problèmes de formation potentiels
-
Déterminer les points d'arrêt optimaux
-
Comparez les performances à différentes époques
Suivi de l'état des emplois
Surveillez l'état de votre tâche RFT via la console Amazon Bedrock.
Phases du job :
-
Validation
-
Entraînement
Indicateurs d'achèvement :
-
Le statut du job passe à Terminé lorsque la formation est terminée avec succès
-
Le modèle d'ARN personnalisé devient disponible pour le déploiement
-
Les indicateurs de formation atteignent les seuils de convergence