SageMaker HyperPod 레시피

Amazon SageMaker HyperPod 레시피는 Llama, Mistral, Mixtral 또는 DeepSeek와 같은 다양한 모델 패밀리에서 공개적으로 사용 가능한 파운데이션 모델(FMs)을 빠르게 훈련하고 미세 조정할 수 AWS있도록에서 제공하는 사전 구성된 훈련 스택입니다. 레시피는 데이터세트 로드, 분산 훈련 기법 적용, 장애 복구 속도를 높이기 위한 체크포인트 관리 등 엔드투엔드 훈련 루프를 자동화합니다.

SageMaker HyperPod 레시피는 대규모 모델 훈련과 관련된 많은 복잡성을 추상화하므로 기계 학습에 대한 깊이 있는 전문성이 없는 사용자에게 특히 유용합니다.

SageMaker HyperPod 내에서 또는 SageMaker 훈련 작업으로 레시피를 실행할 수 있습니다.

다음 표는 SageMaker HyperPod GitHub 리포지토리에서 유지 관리되며 사전 훈련 및 미세 조정에 지원되는 모델, 해당 레시피 및 시작 스크립트, 지원되는 인스턴스 유형 등에 대한 최신 정보를 제공합니다.

사전 훈련에 지원되는 모델, 레시피 및 시작 스크립트의 최신 목록은 pre-training table을 참조하세요.
미세 조정 지원되는 모델, 레시피 및 시작 스크립트의 최신 목록은 fine-tuning table을 참조하세요.

SageMaker HyperPod 사용자의 경우 엔드투엔드 훈련 워크플로의 자동화는 훈련 어댑터를 SageMaker HyperPod 레시피와 통합하여 이루어집니다. 훈련 어댑터는 NVIDIA NeMo 프레임워크 및 Neuronx Distributed Training 패키지를 기반으로 합니다. NeMo 사용에 익숙하다면 훈련 어댑터를 사용하는 프로세스도 동일합니다. 훈련 어댑터는 클러스터에서 레시피를 실행합니다.

SageMaker HyperPod 레시피 워크플로를 보여주는 다이어그램입니다. 상단의 '레시피' 아이콘이 'HyperPod 레시피 런처' 상자에 제공됩니다. 이 상자는 연결된 레시피 파일이 있는 세 개의 GPU 아이콘이 포함된 '클러스터: Slurm, K8s, ...' 레이블이 있는 더 큰 섹션에 연결됩니다. 클러스터 섹션 하단에는 'HyperPod 훈련 어댑터를 사용한 훈련' 레이블이 있습니다.

자체 사용자 지정 레시피를 정의하여 자체 모델을 훈련할 수도 있습니다.

자습서를 시작하려면 자습서 섹션을 참조하세요.

주제

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

고객 관리형 키 암호화

자습서