View a markdown version of this page

PCS와 함께 AWS PCS 지원 DLAMI 사용 - AWS PCS

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

PCS와 함께 AWS PCS 지원 DLAMI 사용

AWS PCS 지원 DLAMI 기본 GPU AMI(Ubuntu 24.04)는 AWS PCS에서 AI/ML 및 HPC 워크로드를 실행하기 위한 AWS 유지 관리형 Amazon Machine Image입니다. 프로덕션 지원 기반을 제공하므로 사용자 지정 AMIs.

포함된 항목

PCS 지원 DLAMI는 Deep Learning Base GPU AMI(Ubuntu 24.04)를 기반으로 하며 다음 AWS PCS 구성 요소를 추가합니다.

  • PCS 에이전트 - AWS PCS 클러스터 관리 에이전트

  • Slurm for AWS PCS - 지원되는 여러 Slurm 버전이 사전 설치되어 있습니다. 올바른 버전은 클러스터의 구성에 따라 인스턴스 시작 중에 자동으로 활성화됩니다.

  • EFS 유틸리티 - Amazon EFS 파일 시스템 탑재용

소스 DLAMI는 운영 체제(Ubuntu 24.04), NVIDIA GPU 드라이버, CUDA 툴킷, EFA 드라이버, Lustre 클라이언트 및 기타 기본 인프라를 제공합니다. 이러한 구성 요소에 대한 자세한 내용은 Deep Learning AMI 릴리스 정보를 참조하세요.

PCS 지원 DLAMI는 x86_64 아키텍처와 arm64 아키텍처 모두에 사용할 수 있습니다.

참고

PCS 지원 DLAMI에는 AI/ML 프레임워크(PyTorch, TensorFlow, JAX), 컴파일러 또는 수학 라이브러리와 같은 애플리케이션 소프트웨어가 포함되지 않습니다. 공유 파일 시스템에서 또는 PCS 지원 DLAMI를 기반으로 사용자 지정 AMI를 구축하여 애플리케이션 계층을 추가할 수 있습니다.

각 AMI의 설명 필드에는 기반이 되는 소스 DLAMI, PCS 에이전트 버전, 지원되는 Slurm 버전 및 EFS 유틸리티 버전을 포함하여 해당 내용이 요약되어 있습니다. Amazon EC2 콘솔에서 또는 describe-images API를 사용하여이 필드를 볼 수 있습니다. 다음은 설명 필드 값의 예입니다.

PCS-Ready DLAMI based on Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20260522. PCS Agent: 1.4.0-1. Slurm: 24.11.7-1, 25.05.7-1, 25.11.2-1. EFS Utils: 2.4.2

현재 PCS 지원 DLAMI 찾기

AWS Management Console
콘솔에서 PCS 지원 DLAMI를 찾으려면
  1. AWS PCS 콘솔을 열고 컴퓨팅 노드 그룹을 생성하거나 편집합니다.

  2. AMI 선택 섹션에서 PCS 지원 AMIs 선택합니다.

  3. 선택한 인스턴스 유형 아키텍처로 필터링된 사용 가능한 PCS 지원 DLAMIs 보여주는 드롭다운이 나타납니다.

  4. AWS PCS 지원 DLAMI 기본 AMI(Ubuntu 24.04)를 선택합니다. 드롭다운에는 참조용으로 아래에 AMI ID와 전체 AMI 이름이 표시됩니다.

AWS CLI

Amazon EC2 Systems Manager 파라미터 스토어를 사용하여 최신 PCS 지원 DLAMI AMI ID를 검색할 수 있습니다. region-code를 로 바꿉니다 AWS 리전.

  • x86_64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id \ --query "Parameter.Value" --output text
  • arm64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/arm64/latest/ami-id \ --query "Parameter.Value" --output text

또는 이름 패턴으로 PCS 지원 DLAMI를 검색할 수 있습니다.

  • x86_64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-x86_64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text
  • arm64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-arm64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text

컴퓨팅 노드 그룹을 생성하거나 업데이트할 때 AMI ID를 사용합니다.

코드형 인프라와 함께 사용

SSM 파라미터 경로는 항상 최신 AMI ID로 확인되는 안정적인 참조를 제공합니다. CloudFormation 템플릿에서 이를 사용하여 재배포 시 새 버전을 자동으로 선택할 수 있습니다.

AmiId: '{{resolve:ssm:/aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id}}'

새 버전으로 업데이트

AWS는 소스 Deep Learning Base GPU AMI가 업데이트되거나 PCS 구성 요소(PCS 에이전트 또는 PCS용 Slurm)가 업데이트될 때 업데이트된 PCS 지원 DLAMI 버전을 릴리스합니다. 클러스터를 업데이트하려면 위에서 설명한 SSM 파라미터 또는 이름 검색을 사용하여 최신 AMI ID를 검색한 다음 각 컴퓨팅 노드 그룹을 업데이트하여 새 AMI ID를 참조합니다.