As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Monitore seu trabalho de treinamento em RFT
Durante o ajuste fino do reforço, você pode monitorar o progresso do treinamento em tempo real usando gráficos e métricas visuais no console Amazon Bedrock. O painel de métricas de treinamento mostra os principais indicadores de desempenho, incluindo pontuações de recompensa, curvas de perda e melhorias de precisão ao longo do tempo. Essas métricas ajudam você a entender se o modelo converge adequadamente e se a função de recompensa orienta efetivamente o processo de aprendizado.
Métricas de treinamento em tempo real
O Amazon Bedrock fornece monitoramento em tempo real durante o treinamento de RFT com gráficos visuais exibindo métricas de treinamento e validação.
Principais métricas de treinamento
-
Perda de treinamento - mede o quão bem o modelo está aprendendo com os dados de treinamento
-
Estatísticas de recompensa de treinamento - Mostra as pontuações de recompensa atribuídas por suas funções de recompensa
-
Margem de recompensa - mede a diferença entre recompensas de resposta boa e ruim
-
Precisão nos conjuntos de treinamento e validação - Mostra o desempenho do modelo nos dados de treinamento e retidos
Visualização do progresso do treinamento
O console exibe gráficos interativos que são atualizados em tempo real à medida que seu trabalho de RFT progride. Essas visualizações podem ajudar você a:
-
Rastreie a convergência em direção ao desempenho ideal
-
Identifique possíveis problemas de treinamento com antecedência
-
Determine os pontos de parada ideais
-
Compare o desempenho em diferentes épocas
Rastreamento do status do trabalho
Monitore o status do seu trabalho de RFT por meio do console Amazon Bedrock.
Fases do trabalho:
-
Validação
-
Treinamento
Indicadores de conclusão:
-
O status do trabalho muda para Concluído quando o treinamento é concluído com êxito
-
O modelo ARN personalizado fica disponível para implantação
-
As métricas de treinamento atingem limites de convergência