Monitore seu trabalho de treinamento em RFT - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitore seu trabalho de treinamento em RFT

Durante o ajuste fino do reforço, você pode monitorar o progresso do treinamento em tempo real usando gráficos e métricas visuais no console Amazon Bedrock. O painel de métricas de treinamento mostra os principais indicadores de desempenho, incluindo pontuações de recompensa, curvas de perda e melhorias de precisão ao longo do tempo. Essas métricas ajudam você a entender se o modelo converge adequadamente e se a função de recompensa orienta efetivamente o processo de aprendizado.

Métricas de treinamento em tempo real

O Amazon Bedrock fornece monitoramento em tempo real durante o treinamento de RFT com gráficos visuais exibindo métricas de treinamento e validação.

Principais métricas de treinamento

  • Perda de treinamento - mede o quão bem o modelo está aprendendo com os dados de treinamento

  • Estatísticas de recompensa de treinamento - Mostra as pontuações de recompensa atribuídas por suas funções de recompensa

  • Margem de recompensa - mede a diferença entre recompensas de resposta boa e ruim

  • Precisão nos conjuntos de treinamento e validação - Mostra o desempenho do modelo nos dados de treinamento e retidos

Visualização do progresso do treinamento

O console exibe gráficos interativos que são atualizados em tempo real à medida que seu trabalho de RFT progride. Essas visualizações podem ajudar você a:

  • Rastreie a convergência em direção ao desempenho ideal

  • Identifique possíveis problemas de treinamento com antecedência

  • Determine os pontos de parada ideais

  • Compare o desempenho em diferentes épocas

Rastreamento do status do trabalho

Monitore o status do seu trabalho de RFT por meio do console Amazon Bedrock.

Fases do trabalho:

  1. Validação

  2. Treinamento

Indicadores de conclusão:

  • O status do trabalho muda para Concluído quando o treinamento é concluído com êxito

  • O modelo ARN personalizado fica disponível para implantação

  • As métricas de treinamento atingem limites de convergência