RFT 훈련 작업 모니터링 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

RFT 훈련 작업 모니터링

강화 미세 조정 중에 Amazon Bedrock 콘솔에서 시각적 그래프와 지표를 사용하여 훈련 진행 상황을 실시간으로 모니터링할 수 있습니다. 훈련 지표 대시보드에는 시간 경과에 따른 보상 점수, 손실 곡선, 정확도 개선 등 주요 성과 지표가 표시됩니다. 이러한 지표는 모델이 제대로 수렴되는지 여부와 보상 함수가 학습 프로세스를 효과적으로 안내하는지 이해하는 데 도움이 됩니다.

실시간 훈련 지표

Amazon Bedrock은 훈련 및 검증 지표를 표시하는 시각적 그래프를 사용하여 RFT 훈련 중에 실시간 모니터링을 제공합니다.

핵심 훈련 지표

  • 훈련 손실 - 모델이 훈련 데이터에서 얼마나 잘 학습하고 있는지 측정합니다.

  • 훈련 보상 통계 - 보상 함수에서 할당한 보상 점수를 표시합니다.

  • 보상 마진 - 좋은 응답 보상과 나쁜 응답 보상의 차이를 측정합니다.

  • 훈련 및 검증 세트의 정확도 - 훈련 및 홀드아웃 데이터 모두에 대한 모델 성능을 보여줍니다.

훈련 진행 상황 시각화

콘솔에는 RFT 작업이 진행됨에 따라 실시간으로 업데이트되는 대화형 그래프가 표시됩니다. 이러한 시각화는 다음과 같은 이점을 제공합니다.

  • 최적의 성능을 향한 수렴 추적

  • 잠재적 훈련 문제를 조기에 식별

  • 최적의 중지 지점 결정

  • 다양한 에포크의 성능 비교

작업 상태 추적

Amazon Bedrock 콘솔을 통해 RFT 작업 상태를 모니터링합니다.

작업 단계:

  1. 검증

  2. 학습

완료 지표:

  • 훈련이 성공적으로 완료되면 작업 상태가 완료됨으로 변경됩니다.

  • 사용자 지정 모델 ARN 배포 가능

  • 훈련 지표가 수렴 임계값에 도달