CloudFormation 템플릿을 사용하여 SageMaker HyperPod 클러스터 생성 - Amazon SageMaker AI

CloudFormation 템플릿을 사용하여 SageMaker HyperPod 클러스터 생성

HyperPod용 CloudFormation 템플릿을 사용하여 SageMaker HyperPod 클러스터를 생성할 수 있습니다. 계속하려면 AWS CLI를 설치해야 합니다.

콘솔에서 리소스를 구성하고 CloudFormation을 사용하여 배포

AWS Management 콘솔을 사용하여 리소스를 구성하고 CloudFormation 템플릿을 사용하여 배포할 수 있습니다.

단계는 다음과 같습니다.

  1. 제출을 선택하는 대신 SageMaker AI 콘솔을 사용하여 SageMaker HyperPod 시작하기의 자습서 끝에 있는 CloudFormation 템플릿 파라미터 다운로드를 선택합니다. 자습서에는 클러스터를 성공적으로 생성하는 데 필요한 중요한 구성 정보가 포함되어 있습니다.

    중요

    제출을 선택하면 클러스터를 삭제할 때까지 동일한 이름의 클러스터를 배포할 수 없습니다.

    CloudFormation 템플릿 파라미터 다운로드를 선택하면 AWS CLI를 사용하여 구성 파일을 사용하여 클러스터 생성 창이 페이지 오른쪽에 나타납니다.

  2. AWS CLI를 사용하여 구성 파일을 사용하여 클러스터 생성 창에서 구성 파라미터 파일 다운로드를 선택합니다. 파일이 머신에 다운로드됩니다. 필요에 따라 구성 JSON 파일을 편집하거나 변경이 필요하지 않은 경우 그대로 둘 수 있습니다.

  3. 터미널에서 파라미터 파일 file://params.json의 위치로 이동합니다.

  4. create-stack AWS CLI 명령을 실행하여 구성된 리소스를 프로비저닝하고 HyperPod 클러스터를 생성할 CloudFormation 스택을 배포합니다.

    aws cloudformation create-stack --stack-name my-stack --template-url https://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  5. 리소스 프로비저닝 상태를 보려면 CloudFormation 콘솔로 이동합니다.

    클러스터 생성이 완료되면 SageMaker HyperPod 콘솔의 메인 창에 있는 클러스터에서 새 클러스터를 확인합니다. 상태 열에서 표시되는 상태를 확인할 수도 있습니다.

  6. 클러스터 상태가 InService로 전환되면 클러스터 노드에 로그인을 시작할 수 있습니다. 클러스터 노드에 액세스하고 ML 워크로드 실행을 시작하려면 SageMaker HyperPod 클러스터의 작업 섹션을 참조하세요.

리소스를 구성하고 CloudFormation을 사용하여 배포

SageMaker HyperPod용 CloudFormation 템플릿을 사용하여 리소스를 구성하고 배포할 수 있습니다.

단계는 다음과 같습니다.

  1. sagemaker-hyperpod-cluster-setup GitHub 리포지토리에서 SageMaker HyperPod용 CloudFormation 템플릿을 다운로드합니다.

  2. create-stack AWS CLI 명령을 실행하여 구성된 리소스를 프로비저닝하고 HyperPod 클러스터를 생성할 CloudFormation 스택을 배포합니다.

    aws cloudformation create-stack --stack-name my-stack --template-url URL_of_the_file_that_contains_the_template_body --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  3. 리소스 프로비저닝 상태를 보려면 CloudFormation 콘솔로 이동합니다.

    클러스터 생성이 완료되면 SageMaker HyperPod 콘솔의 메인 창에 있는 클러스터에서 새 클러스터를 확인합니다. 상태 열에서 표시되는 상태를 확인할 수도 있습니다.

  4. 클러스터 상태가 InService로 전환되면 클러스터 노드에 로그인을 시작할 수 있습니다. 클러스터 노드에 액세스하고 ML 워크로드 실행을 시작하려면 SageMaker HyperPod 클러스터의 작업 섹션을 참조하세요.