CloudFormation 템플릿을 사용하여 SageMaker HyperPod 클러스터 생성
HyperPod용 CloudFormation 템플릿을 사용하여 SageMaker HyperPod 클러스터를 생성할 수 있습니다. 계속하려면 AWS CLI를 설치해야 합니다.
콘솔에서 리소스를 구성하고 CloudFormation을 사용하여 배포
AWS Management 콘솔을 사용하여 리소스를 구성하고 CloudFormation 템플릿을 사용하여 배포할 수 있습니다.
단계는 다음과 같습니다.
-
제출을 선택하는 대신 SageMaker AI 콘솔을 사용하여 SageMaker HyperPod 시작하기의 자습서 끝에 있는 CloudFormation 템플릿 파라미터 다운로드를 선택합니다. 자습서에는 클러스터를 성공적으로 생성하는 데 필요한 중요한 구성 정보가 포함되어 있습니다.
중요
제출을 선택하면 클러스터를 삭제할 때까지 동일한 이름의 클러스터를 배포할 수 없습니다.
CloudFormation 템플릿 파라미터 다운로드를 선택하면 AWS CLI를 사용하여 구성 파일을 사용하여 클러스터 생성 창이 페이지 오른쪽에 나타납니다.
-
AWS CLI를 사용하여 구성 파일을 사용하여 클러스터 생성 창에서 구성 파라미터 파일 다운로드를 선택합니다. 파일이 머신에 다운로드됩니다. 필요에 따라 구성 JSON 파일을 편집하거나 변경이 필요하지 않은 경우 그대로 둘 수 있습니다.
-
터미널에서 파라미터 파일
file://params.json의 위치로 이동합니다. -
create-stack AWS CLI 명령을 실행하여 구성된 리소스를 프로비저닝하고 HyperPod 클러스터를 생성할 CloudFormation 스택을 배포합니다.
aws cloudformation create-stack --stack-namemy-stack--template-urlhttps://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
리소스 프로비저닝 상태를 보려면 CloudFormation 콘솔
로 이동합니다. 클러스터 생성이 완료되면 SageMaker HyperPod 콘솔의 메인 창에 있는 클러스터에서 새 클러스터를 확인합니다. 상태 열에서 표시되는 상태를 확인할 수도 있습니다.
-
클러스터 상태가
InService로 전환되면 클러스터 노드에 로그인을 시작할 수 있습니다. 클러스터 노드에 액세스하고 ML 워크로드 실행을 시작하려면 SageMaker HyperPod 클러스터의 작업 섹션을 참조하세요.
CloudFormation을 사용하여 리소스 구성 및 배포
SageMaker HyperPod용 CloudFormation 템플릿을 사용하여 리소스를 구성하고 배포할 수 있습니다.
단계는 다음과 같습니다.
-
sagemaker-hyperpod-cluster-setup
GitHub 리포지토리에서 SageMaker HyperPod용 CloudFormation 템플릿을 다운로드합니다. -
create-stack AWS CLI 명령을 실행하여 구성된 리소스를 프로비저닝하고 HyperPod 클러스터를 생성할 CloudFormation 스택을 배포합니다.
aws cloudformation create-stack --stack-namemy-stack--template-urlURL_of_the_file_that_contains_the_template_body--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
리소스 프로비저닝 상태를 보려면 CloudFormation 콘솔로 이동합니다.
클러스터 생성이 완료되면 SageMaker HyperPod 콘솔의 메인 창에 있는 클러스터에서 새 클러스터를 확인합니다. 상태 열에서 표시되는 상태를 확인할 수도 있습니다.
-
클러스터 상태가
InService로 전환되면 클러스터 노드에 로그인을 시작할 수 있습니다.