반복 학습

반복 훈련은 여러 훈련 주기를 통해 모델을 미세 조정하는 체계적인 접근 방식으로, 각 라운드는 평가를 통해 발견된 특정 약점을 해결하여 이전 체크포인트를 기반으로 빌드됩니다. 이 방법을 사용하면 실패 모드를 해결하는 선별된 예제를 통합하고, 변화하는 요구 사항에 적응하며, 긴 단일 훈련 실행에 커밋하는 대신 점진적으로 개선 사항을 검증하여 모델 성능을 목표로 개선할 수 있습니다. 이 프로세스는 일반적으로 지도 미세 조정(SFT) 및 보상 기반 미세 조정(RFT)과 같은 패턴을 따르며, 이때 파이프라인 전체에서 모델 유형 및 훈련 기법의 일관성을 유지 관리하면서 후속 훈련 반복을 위해 참조할 수 있는 AWS 관리형 에스크로 S3 버킷에 체크포인트가 저장됩니다.

자세한 내용은 반복 훈련 단원을 참조하십시오.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.