지도 미세 조정(SFT) - Amazon Nova

지도 미세 조정(SFT)

SFT 훈련 프로세스는 다음과 같은 두 가지 주요 단계로 구성됩니다.

  • 데이터 준비: 정해진 지침에 따라 데이터세트를 생성, 정리 또는 필요한 구조로 다시 포맷합니다. 입력, 출력 및 보조 정보(예: 추론 트레이스 또는 메타데이터)가 올바르게 조정되고 형식이 지정되었는지 확인합니다.

  • 훈련 구성: 모델 훈련 방법을 정의합니다. Amazon SageMaker HyperPod를 사용하는 경우 이 구성은 다음을 포함하는 YAML 레시피 파일로 작성됩니다.

    • 데이터 소스 경로(훈련 및 검증 데이터세트)

    • 주요 하이퍼파라미터(에포크, 학습 속도, 배치 크기)

    • 선택적 구성 요소(분산 훈련 파라미터 등)

Nova 모델 비교 및 선택

Amazon Nova 2.0은 Amazon Nova 1.0보다 더 크고 다양한 데이터세트를 기반으로 훈련된 모델입니다. 주요 개선 사항에는 다음이 포함됩니다.

  • 개선된 추론 기능: 명시적 추론 모드 지원 포함

  • 더 광범위한 다국어 성능: 추가 언어에서 지원

  • 복잡한 태스크에서 개선된 성능: 코딩 및 도구 사용 포함

  • 확장된 컨텍스트 처리: 더 긴 컨텍스트 길이에서 정확도와 안정성 개선

Nova 1.0 및 Nova 2.0을 사용해야 하는 경우

다음과 같은 경우 Amazon Nova 1.0을 선택합니다.

  • 사용 사례에 고급 추론 없이 표준 언어 이해가 필요함

  • Amazon Nova 1.0에서 성능이 이미 검증되었으며 추가 기능이 필요하지 않음