지도 미세 조정(SFT)
SFT 훈련 프로세스는 다음과 같은 두 가지 주요 단계로 구성됩니다.
-
데이터 준비: 정해진 지침에 따라 데이터세트를 생성, 정리 또는 필요한 구조로 다시 포맷합니다. 입력, 출력 및 보조 정보(예: 추론 트레이스 또는 메타데이터)가 올바르게 조정되고 형식이 지정되었는지 확인합니다.
-
훈련 구성: 모델 훈련 방법을 정의합니다. Amazon SageMaker HyperPod를 사용하는 경우 이 구성은 다음을 포함하는 YAML 레시피 파일로 작성됩니다.
-
데이터 소스 경로(훈련 및 검증 데이터세트)
-
주요 하이퍼파라미터(에포크, 학습 속도, 배치 크기)
-
선택적 구성 요소(분산 훈련 파라미터 등)
-
Nova 모델 비교 및 선택
Amazon Nova 2.0은 Amazon Nova 1.0보다 더 크고 다양한 데이터세트를 기반으로 훈련된 모델입니다. 주요 개선 사항에는 다음이 포함됩니다.
-
개선된 추론 기능: 명시적 추론 모드 지원 포함
-
더 광범위한 다국어 성능: 추가 언어에서 지원
-
복잡한 태스크에서 개선된 성능: 코딩 및 도구 사용 포함
-
확장된 컨텍스트 처리: 더 긴 컨텍스트 길이에서 정확도와 안정성 개선
Nova 1.0 및 Nova 2.0을 사용해야 하는 경우
다음과 같은 경우 Amazon Nova 1.0을 선택합니다.
-
사용 사례에 고급 추론 없이 표준 언어 이해가 필요함
-
Amazon Nova 1.0에서 성능이 이미 검증되었으며 추가 기능이 필요하지 않음