Amazon EKS용 SageMaker HyperPod AMI 릴리스 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon EKS용 SageMaker HyperPod AMI 릴리스

다음 릴리스 정보는 Amazon EKS 오케스트레이션을 위한 Amazon SageMaker HyperPod AMI 릴리스의 최신 업데이트를 추적합니다. 각 릴리스 정보에는 Amazon EKS용 SageMaker HyperPod DLAMI 지원에 사전 설치되거나 사전 구성된 패키지의 요약 목록이 나와 있습니다. 각 DLAMI는 AL2023을 기반으로 하며 특정 Kubernetes 버전을 지원합니다. Slurm 오케스트레이션을 위한 HyperPod DLAMI 릴리스는 Slurm용 SageMaker HyperPod AMI 릴리스 섹션을 참조하세요. Amazon SageMaker HyperPod 기능 릴리스에 대한 자세한 내용은 Amazon SageMaker HyperPod 릴리스 정보 섹션을 참조하세요.

Amazon EKS용 SageMaker Hyperpod AMI 릴리스: 2025년 11월 22일

AMI 일반 업데이트

  • Amazon EKS 버전 1.28, 1.29, 1.30, 1.31, 1.32, 1.33용 SageMaker Hyperpod AMI에 대한 업데이트를 릴리스했습니다.

  • 기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.

Amazon EKS용 SageMaker Hyperpod DLAMI 지원

다음은 이 릴리스의 업데이트 사항입니다.

Kubernetes v1.28
  • 이제 AL2가 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • Linux 커널 버전: 5.10

    • Glibc 버전: 2.26

    • OpenSSL 버전: 1.0.2k-fips

    • FSx Lustre 클라이언트 버전: 2.12.8

    • Docker 버전: Docker 버전 25.0.13, 빌드 0bab007

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너 github.com/containerd/containerd 1.7.27

    • aws CLI v2 버전: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.2

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.7.16

    • Kubernetes 버전: v1.28.15-eks-473151a

    • iptables-services 버전: 1.8.4

    • nginx 버전: 1.20.1

    • nvme-cli 버전: 1.11.1

    • epel-release 버전: 7

    • 스트레스 버전: 1.0.4

    • 수집 버전: 5.8.1

    • acl 버전: 2.2.51

    • rsyslog 버전: 8.24.0

    • lustre-client 버전: 2.12.8

    • systemd 버전: 219

    • openssh 버전: 7.4

    • sudo 버전: 1.8.23

    • gcc 버전: 7.3.1

    • cmake 버전: 2.8.12.2

    • git 버전: 2.47.3

    • 메이크 버전: 3.82

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 1.3.0

    • lvm2 버전: 2.02.187

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

  • AL2023(x86_64):

    • Linux 커널 버전: 6.1

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너 github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.28.15-eks-473151a

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

Kubernetes v1.29
  • 이제 AL2가 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • Linux 커널 버전: 5.10

    • Glibc 버전: 2.26

    • OpenSSL 버전: 1.0.2k-fips

    • FSx Lustre 클라이언트 버전: 2.12.8

    • Docker 버전: Docker 버전 25.0.13, 빌드 0bab007

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너 github.com/containerd/containerd 1.7.27

    • aws CLI v2 버전: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.2

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.7.16

    • Kubernetes 버전: v1.29.15-eks-473151a

    • iptables-services 버전: 1.8.4

    • nginx 버전: 1.20.1

    • nvme-cli 버전: 1.11.1

    • epel-release 버전: 7

    • 스트레스 버전: 1.0.4

    • 수집 버전: 5.8.1

    • acl 버전: 2.2.51

    • rsyslog 버전: 8.24.0

    • lustre-client 버전: 2.12.8

    • systemd 버전: 219

    • openssh 버전: 7.4

    • sudo 버전: 1.8.23

    • gcc 버전: 7.3.1

    • cmake 버전: 2.8.12.2

    • git 버전: 2.47.3

    • 메이크 버전: 3.82

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 1.3.0

    • lvm2 버전: 2.02.187

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

  • AL2023(x86_64):

    • Linux 커널 버전: 6.1

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너형 github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.29.15-eks-473151a

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

Kubernetes v1.30
  • 이제 AL2는 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • Linux 커널 버전: 5.10

    • Glibc 버전: 2.26

    • OpenSSL 버전: 1.0.2k-fips

    • FSx Lustre 클라이언트 버전: 2.12.8

    • Docker 버전: Docker 버전 25.0.13, 빌드 0bab007

    • Runc 버전: 1.3.2

    • 컨테이너 버전: 컨테이너형 github.com/containerd/containerd 1.7.27

    • aws CLI v2 버전: aws-cli/1.42.69 Python/3.10.17 Linux/5.10.245-241.976.amzn2.x86_64 botocore/1.40.69

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.2

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.7.16

    • Kubernetes 버전: v1.30.11-eks-473151a

    • iptables-services 버전: 1.8.4

    • nginx 버전: 1.20.1

    • nvme-cli 버전: 1.11.1

    • epel-release 버전: 7

    • 스트레스 버전: 1.0.4

    • 수집 버전: 5.8.1

    • acl 버전: 2.2.51

    • rsyslog 버전: 8.24.0

    • lustre-client 버전: 2.12.8

    • systemd 버전: 219

    • openssh 버전: 7.4

    • sudo 버전: 1.8.23

    • gcc 버전: 7.3.1

    • cmake 버전: 2.8.12.2

    • git 버전: 2.47.3

    • 메이크 버전: 3.82

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 1.3.0

    • lvm2 버전: 2.02.187

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 58.

  • AL2023(x86_64):

    • Linux 커널 버전: 6.1

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너 github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.30.11-eks-473151a

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

Kubernetes v1.31
  • 이제 AL2가 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • Linux 커널 버전: 5.10

    • Glibc 버전: 2.26

    • OpenSSL 버전: 1.0.2k-fips

    • FSx Lustre 클라이언트 버전: 2.12.8

    • Docker 버전: Docker 버전 25.0.13, 빌드 0bab007

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너 github.com/containerd/containerd 1.7.27

    • aws CLI v2 버전: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.2

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.7.16

    • Kubernetes 버전: v1.31.7-eks-473151a

    • iptables-services 버전: 1.8.4

    • nginx 버전: 1.20.1

    • nvme-cli 버전: 1.11.1

    • epel-release 버전: 7

    • 스트레스 버전: 1.0.4

    • 수집 버전: 5.8.1

    • acl 버전: 2.2.51

    • rsyslog 버전: 8.24.0

    • lustre-client 버전: 2.12.8

    • systemd 버전: 219

    • openssh 버전: 7.4

    • sudo 버전: 1.8.23

    • gcc 버전: 7.3.1

    • cmake 버전: 2.8.12.2

    • git 버전: 2.47.3

    • 메이크 버전: 3.82

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 1.3.0

    • lvm2 버전: 2.02.187

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

  • AL2023(x86_64):

    • Linux 커널 버전: 6.1

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너 github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.31.13-eks-113cf36

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

  • AL2023(ARM64):

    • Linux 커널 버전: 6.12

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너형 github.com/containerd/containerd 1.7.27

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.31.13-eks-113cf36

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • nvidia-imex 버전: 580.95.05

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 58.

Kubernetes v1.32
  • 이제 AL2가 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • Linux 커널 버전: 5.10

    • Glibc 버전: 2.26

    • OpenSSL 버전: 1.0.2k-fips

    • FSx Lustre 클라이언트 버전: 2.12.8

    • Docker 버전: Docker 버전 25.0.13, 빌드 0bab007

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너형 github.com/containerd/containerd 1.7.27

    • aws CLI v2 버전: aws-cli/1.42.74 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.74

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.2

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.7.16

    • Kubernetes 버전: v1.32.3-eks-473151a

    • iptables-services 버전: 1.8.4

    • nginx 버전: 1.20.1

    • nvme-cli 버전: 1.11.1

    • epel-release 버전: 7

    • 스트레스 버전: 1.0.4

    • 수집 버전: 5.8.1

    • acl 버전: 2.2.51

    • rsyslog 버전: 8.24.0

    • lustre-client 버전: 2.12.8

    • systemd 버전: 219

    • openssh 버전: 7.4

    • sudo 버전: 1.8.23

    • gcc 버전: 7.3.1

    • cmake 버전: 2.8.12.2

    • git 버전: 2.47.3

    • 메이크 버전: 3.82

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 1.3.0

    • lvm2 버전: 2.02.187

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

  • AL2023(x86_64):

    • Linux 커널 버전: 6.1

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너형 github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.32.9-eks-113cf36

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

  • AL2023(ARM64):

    • Linux 커널 버전: 6.12

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너형 github.com/containerd/containerd 1.7.27

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.32.9-eks-113cf36

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • nvidia-imex 버전: 580.95.05

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 58.

Kubernetes v1.33
  • AL2023(x86_64):

    • Linux 커널 버전: 6.1

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너형 github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS 버전: 2.24.7.0

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.33.5-eks-113cf36

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 59.

  • AL2023(ARM64):

    • Linux 커널 버전: 6.12

    • Glibc 버전: 2.34

    • OpenSSL 버전: 3.2.2

    • FSx Lustre 클라이언트 버전: 2.15.6

    • Runc 버전: 1.3.3

    • 컨테이너 버전: 컨테이너형 github.com/containerd/containerd 1.7.27

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 12.8

    • ENA 드라이버 버전: 2.15.0g

    • Python 버전: 3.9.24

    • Kubernetes 버전: v1.33.5-eks-113cf36

    • iptables-services 버전: 1.8.8

    • nginx 버전: 1.28.0

    • nvme-cli 버전: 2.13 1.13

    • 스트레스 버전: 1.0.7

    • 수집 버전: 5.12.0.

    • acl 버전: 2.3.1

    • lustre-client 버전: 2.15.6

    • nvidia-imex 버전: 580.95.05

    • systemd 버전: 252

    • openssh 버전: 8.7

    • sudo 버전: 1.9.15

    • gcc 버전: 11.5.0

    • cmake 버전: 3.22.2

    • git 버전: 2.50.1

    • 메이크 버전: 4.3

    • cloudwatch-agent 버전: 1.300060.1

    • nfs-utils 버전: 2.5.4

    • lvm2 버전: 2.03.16

    • ec2-instance-connect 버전: 1.1

    • aws-cfn-bootstrap 버전: 2.0

    • rdma-core 버전: 58.

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 11월 7일

AMI 일반 업데이트

  • Amazon EKS 버전 1.28, 1.29, 1.30, 1.31, 1.32 및 1.33용 SageMaker HyperPod AMI에 대한 업데이트를 릴리스했습니다.

  • 기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.

Amazon EKS용 SageMaker HyperPod DLAMI 지원

다음은 이 릴리스의 업데이트 사항입니다.

Kubernetes v1.28
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.28.15

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.28.15

  • 패키지 업데이트에는 boto3, botocore, pip, regex, psutil 및 nvidia 컨테이너 툴킷 구성 요소가 포함됩니다.

  • 패키지 추가: annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.29.15

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.29.15

  • 패키지 업데이트에는 커널 업데이트, glibc 업데이트 및 다양한 시스템 라이브러리가 포함됩니다.

  • 패키지 추가: annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.30.11

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.30.11

  • 패키지 업데이트에는 커널 livepatch 업데이트 및 시스템 라이브러리 업데이트가 포함됩니다.

  • 패키지 추가: annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.31.7

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.31.13

  • AL2023(arm):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.31.13

    • 커널 버전: 6.12.46-66.121.amzn2023.aarch64

  • 패키지 업데이트에는 광범위한 시스템 라이브러리 업데이트, 커널 업데이트 및 부스트 라이브러리 업데이트가 포함됩니다.

  • 추가된 패키지: apr-util-lmdb, kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.32.3

    • AWSIAM Authenticator 버전: v0.6.29

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.32.9

  • AL2023(arm):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.32.9

    • 커널 버전: 6.12.46-66.121.amzn2023.aarch64

  • 패키지 업데이트에는 커널 livepatch 업데이트 및 시스템 라이브러리 업데이트가 포함됩니다.

  • 패키지 추가: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.33.5

    • 커널 버전: 6.1.155-176.282.amzn2023.x86_64

  • AL2023(arm):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.33.5

    • 커널 버전: 6.12.46-66.121.amzn2023.aarch64

  • 패키지 업데이트에는 광범위한 시스템 라이브러리 업데이트, 커널 업데이트 및 부스트 라이브러리 업데이트가 포함됩니다.

  • 추가된 패키지: apr-util-lmdb, kernel-livepatch 업데이트

참고

runc 버전이 1.3.2 보안 게시판으로 업그레이드되었습니다.

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 10월 29일

AMI 일반 업데이트

  • Amazon EKS 버전 1.28, 1.29, 1.30, 1.31, 1.32 및 1.33용 SageMaker HyperPod AMI에 대한 업데이트를 릴리스했습니다.

  • 기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.

Amazon EKS용 SageMaker HyperPod DLAMI 지원

다음은 이 릴리스의 업데이트 사항입니다.

Kubernetes v1.28
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.28.15

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.28.15

  • 패키지 업데이트에는 boto3, botocore, pip, regex, psutil 및 nvidia 컨테이너 툴킷 구성 요소가 포함됩니다.

  • 패키지 추가: annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.29.15

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.29.15

  • 패키지 업데이트에는 커널 업데이트, glibc 업데이트 및 다양한 시스템 라이브러리가 포함됩니다.

  • 패키지 추가: annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.30.11

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.30.11

  • 패키지 업데이트에는 커널 livepatch 업데이트 및 시스템 라이브러리 업데이트가 포함됩니다.

  • 패키지 추가: annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.31.7

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.31.13

  • AL2023(arm):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.31.13

    • 커널 버전: 6.12.46-66.121.amzn2023.aarch64

  • 패키지 업데이트에는 광범위한 시스템 라이브러리 업데이트, 커널 업데이트 및 부스트 라이브러리 업데이트가 포함됩니다.

  • 추가된 패키지: apr-util-lmdb, kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • AL2(x86_64):

    • NVIDIA 드라이버 버전: 570.195.03

    • CUDA 버전: 12.8

    • Kubernetes 버전: 1.32.3

  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.32.9

  • AL2023(arm):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.32.9

    • 커널 버전: 6.12.46-66.121.amzn2023.aarch64

  • 패키지 업데이트에는 커널 livepatch 업데이트 및 시스템 라이브러리 업데이트가 포함됩니다.

  • 패키지 추가: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023(x86_64):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.33.5

    • 커널 버전: 6.1.155-176.282.amzn2023.x86_64

  • AL2023(arm):

    • NVIDIA 드라이버 버전: 580.95.05

    • CUDA 버전: 13.0

    • Kubernetes 버전: 1.33.5

    • 커널 버전: 6.12.46-66.121.amzn2023.aarch64

  • 패키지 업데이트에는 광범위한 시스템 라이브러리 업데이트, 커널 업데이트 및 부스트 라이브러리 업데이트가 포함됩니다.

  • 패키지 추가: apr-util-lmdb, 커널-livepatch 업데이트

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 10월 22일

AL2x86

참고

Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.

  • EKS 버전 1.28 - 1.32

  • 이 릴리스에는 Nvidia 10월 보안 공지에 있는 영향을 받는 NVIDIA 드라이버 패키지에 대한 CVE 패치가 포함되어 있습니다.

  • NVIDIA SMI

    NVIDIA-SMI 570.195.03 Driver Version: 570.195.03 CUDA Version: 12.8
  • 메이저 버전

    패키지 이름 버전
    Framework_버전 70
    gdr_copy 2.4.1
    supported_ec2_instances G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_driver 570.195.03
    python_location /usr/bin/python3.10
    nvidia_cuda_stack /usr/local/cuda-12.1,/usr/local/cuda-12.2,/usr/local/cuda-12.3,/usr/local/cuda-12.4
    ssm_agent_version 3.3.3050.0
    커널_버전 5.10.244-240.965.amzn2.x86_64
    nvidia_container_toolkit_version 1.17.8
    ofi_nccl_버전 1.16.3
    운영 체제 Amazon Linux 2
    default_cuda /usr/local/cuda-12.1/
    컴퓨팅_아키텍처 x86_64
  • 패키지 추가됨:이 릴리스에는 패키지가 추가되지 않았습니다.

  • 업데이트된 패키지

    패키지 이름 이전 버전 새 버전
    boto3 1.40.46 1.40.49
    botocore 1.40.46 1.40.49
    fastapi 0.118.0 0.118.2
    파일 잠금 3.19.1 3.20.0
    importlib_metadata 8.7.0 8.0.0
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    matplotlib 3.10.6 3.10.7
    패키징 25 24.2
    platformdirs 4.4.0 4.5.0
    propcache 0.4.0 0.4.1
    리치 14.1.0 14.2.0
    tomli 2.2.1 2.3.0
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    virtualenv 20.34.0 20.35.1
    websocket-클라이언트 1.8.0 1.9.0
  • 패키지 제거됨:이 릴리스에서는 패키지가 제거되지 않았습니다.

AL2023x86

기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.

  • EKS 버전 1.28 - 1.32. EKS 버전 1.33에는 릴리스가 없습니다.

  • 이 릴리스에는 Nvidia 10월 보안 공지에 있는 영향을 받는 NVIDIA 드라이버 패키지에 대한 CVE 패치가 포함되어 있습니다.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • 메이저 버전

    패키지 이름 버전
    gdr_copy 2.5.1
    supported_ec2_instances G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_gds_version 1.15.0.42
    nvidia_driver 580.95.05
    python_location /usr/bin/python3.9
    nvidia_cuda_stack /usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda-13.0
    ssm_agent_version 3.3.3050.0
    커널_버전 6.1.153-175.280.amzn2023.x86_64
    nvidia_container_toolkit_version 1.17.8
    dcgm_version 4.4.1
    ofi_nccl_버전 1.16.3
    운영 체제 Amazon Linux 2023.9.20250929
    default_cuda /usr/local/cuda-12.9/
    컴퓨팅_아키텍처 x86_64
  • 패키지 추가됨:이 릴리스에는 패키지가 추가되지 않았습니다.

  • 업데이트된 패키지

    패키지 이름 이전 버전 새 버전
    boto3 1.40.46 1.40.49
    botocore 1.40.46 1.40.49
    fastapi 0.118.0 0.118.2
    gdrcopy 2.5-1 2.5.1-1
    gdrcopy-devel 2.5-1 2.5.1-1
    gdrcopy-kmod 2.5~1dkm 2.5.1~1dkm
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    more-itertools 10.8.0 10.3.0
    패키징 25 24.2
    propcache 0.4.0 0.4.1
    pydantic 2.11.10 2.12.0
    pydantic_core 2.33.2 2.41.1
    리치 14.1.0 14.2.0
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    typing_extensions 4.12.2 4.15.0
    virtualenv 20.34.0 20.35.1
    websocket-클라이언트 1.8.0 1.9.0
  • 패키지 제거됨:이 릴리스에서는 패키지가 제거되지 않았습니다.

AL2023 ARM64

기본 DLAMI 릴리스 정보는 여기에서 확인할 수 있습니다.

  • EKS 버전 1.31 - 1.33.

  • 이 릴리스에는 Nvidia 10월 보안 공지에 있는 영향을 받는 NVIDIA 드라이버 패키지에 대한 CVE 패치가 포함되어 있습니다.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • 메이저 버전

    패키지 이름 버전
    gdr_copy 2.5
    supported_ec2_instances G5g, P6e-GB200
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_driver 580.95.05
    python_location /usr/bin/python3.9
    nvidia_cuda_stack /usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda-13.0
    ssm_agent_version 3.3.3050.0
    커널_버전 6.12.46-66.121.amzn2023.aarch64
    nvidia_container_toolkit_version 1.17.8
    dcgm_version 4.4.1
    ofi_nccl_버전 1.16.3
    운영 체제 Amazon Linux 2023.9.20250929
    default_cuda /usr/local/cuda-12.9/
    컴퓨팅_아키텍처 aarch64
  • 패키지 추가됨:이 릴리스에는 패키지가 추가되지 않았습니다.

  • 업데이트된 패키지

    패키지 이름 이전 버전 새 버전
    aiohttp 3.12.15 3.13.0
    attrs 25.3.0 25.4.0
    boto3 1.40.45 1.40.49
    botocore 1.40.45 1.40.49
    cattrs 25.2.0 25.3.0
    certifi 2025.8.3 2025.10.5
    efa 2.17.2-1.amzn2023 2.17.3-1.amzn2023
    fastapi 0.118.0 0.118.2
    동결 목록 1.7.0 1.8.0
    importlib_metadata 8.7.0 8.0.0
    jaraco.context 5.3.0 6.0.1
    멀티텍스트 6.6.4 6.7.0
    narwhals 2.6.0 2.7.0
    nh3 0.3.0 0.3.1
    propcache 0.3.2 0.4.1
    pydantic 2.11.9 2.12.0
    pydantic_core 2.33.2 2.41.1
    스타일린트 3.3.8 3.3.9
    python-json-logger 3.3.0 4.0.0
    리치 14.1.0 14.2.0
    tomli 2.2.1 2.0.1
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    virtualenv 20.34.0 20.35.1
    websocket-클라이언트 1.8.0 1.9.0
    yarl 1.20.1 1.22.0
    zipp 3.19.2 3.23.0
  • 패키지 제거됨:이 릴리스에서는 패키지가 제거되지 않았습니다.

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 9월 29일

AMI 일반 업데이트

  • Amazon EKS 1.33용 새 SageMaker HyperPod AMI를 릴리스했습니다. 자세한 내용은 Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 9월 29일을 참조하세요.

    중요
    • 동적 리소스 할당 베타 Kubernetes API는이 릴리스에서 기본적으로 활성화됩니다.

      • 이 API는 GPUs.

      • 이 API는 오픈 소스 Kubernetes 커뮤니티에서 개발되었으며 Kubernetes의 향후 버전에서 변경될 수 있습니다. API를 사용하기 전에 Kubernetes 설명서를 검토하고 워크로드에 미치는 영향을 이해합니다.

    • HyperPod는 AL2023으로 마이그레이션하는 Kubernetes 1.33.AWSrecommds용 HyperPod Amazon Linux 2 AMI를 릴리스하지 않습니다. 자세한 내용은 Amazon Linux 2에서 AL2023으로 업그레이드를 참조하세요.

자세한 내용은 Kubernetes v1.33을 참조하세요.

Amazon EKS용 SageMaker HyperPod DLAMI 지원

다음은 이 릴리스의 업데이트 사항입니다.

Kubernetes v1.28
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • NVIDIA SMI:

    • NVIDIA 드라이버 버전: 570.172.08

    • CUDA 버전: 12.8

  • 패키지:

    • 언어 및 코어 라이브러리:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • 코어 라이브러리:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ 유틸리티: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa 드라이버: 2.17.2-1.amzn2023

      • efa 구성: 1.18-1.amzn2023

      • efa nv 피어름: 1.2.2-1.amzn2023

      • efa 프로파일: 1.7-1.amzn2023

    • 커널:

      • 커널: 6.1.148-173.267.amzn2023

      • 커널 개발: 6.1.148-173.267.amzn2023

      • 커널 헤더: 6.1.148-173.267.amzn2023

      • 커널 도구: 6.1.148-173.267.amzn2023

      • 커널 모듈 추가: 6.1.148-173.267.amzn2023

      • 커널 livepatch: 1.0-0.amzn2023

    • NVIDIA:

      • nvidia 컨테이너 툴킷: 1.17.8-1

      • nvidia 컨테이너 툴킷 기반: 1.17.8-1

      • libnvidia-container: 1.17.8-1(도구 사용)

      • nvidia 패브릭 관리자: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.29
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • NVIDIA SMI:

    • NVIDIA 드라이버 버전: 570.172.08

    • CUDA 버전: 12.8

  • 패키지:

    • 언어 및 코어 라이브러리:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • 코어 라이브러리:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ 유틸리티: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa 드라이버: 2.17.2-1.amzn2023

      • efa 구성: 1.18-1.amzn2023

      • efa nv 피어름: 1.2.2-1.amzn2023

      • efa 프로파일: 1.7-1.amzn2023

    • 커널:

      • 커널: 6.1.148-173.267.amzn2023

      • 커널 개발: 6.1.148-173.267.amzn2023

      • 커널 헤더: 6.1.148-173.267.amzn2023

      • 커널 도구: 6.1.148-173.267.amzn2023

      • 커널 모듈 추가: 6.1.148-173.267.amzn2023

      • 커널 livepatch: 1.0-0.amzn2023

    • NVIDIA:

      • nvidia 컨테이너 툴킷: 1.17.8-1

      • nvidia 컨테이너 툴킷 기반: 1.17.8-1

      • libnvidia-container: 1.17.8-1(도구 포함)

      • nvidia 패브릭 관리자: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.30
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • NVIDIA SMI:

    • NVIDIA 드라이버 버전: 570.172.08

    • CUDA 버전: 12.8

  • 패키지:

    • 언어 및 코어 라이브러리:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • 코어 라이브러리:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ 유틸리티: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa 드라이버: 2.17.2-1.amzn2023

      • efa 구성: 1.18-1.amzn2023

      • efa nv 피어름: 1.2.2-1.amzn2023

      • efa 프로파일: 1.7-1.amzn2023

    • 커널:

      • 커널: 6.1.148-173.267.amzn2023

      • 커널 개발: 6.1.148-173.267.amzn2023

      • 커널 헤더: 6.1.148-173.267.amzn2023

      • 커널 도구: 6.1.148-173.267.amzn2023

      • 커널 모듈 추가: 6.1.148-173.267.amzn2023

      • 커널 livepatch: 1.0-0.amzn2023

    • NVIDIA:

      • nvidia 컨테이너 툴킷: 1.17.8-1

      • nvidia 컨테이너 툴킷 기반: 1.17.8-1

      • libnvidia-container: 1.17.8-1(도구 포함)

      • nvidia 패브릭 관리자: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.31
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • NVIDIA SMI:

    • NVIDIA 드라이버 버전: 570.172.08

    • CUDA 버전: 12.8

  • 패키지:

    • 언어 및 코어 라이브러리:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • 코어 라이브러리:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ 유틸리티: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa 드라이버: 2.17.2-1.amzn2023

      • efa 구성: 1.18-1.amzn2023

      • efa nv 피어름: 1.2.2-1.amzn2023

      • efa 프로파일: 1.7-1.amzn2023

    • 커널:

      • 커널: 6.1.148-173.267.amzn2023

      • 커널 개발: 6.1.148-173.267.amzn2023

      • 커널 헤더: 6.1.148-173.267.amzn2023

      • 커널 도구: 6.1.148-173.267.amzn2023

      • 커널 모듈 추가: 6.1.148-173.267.amzn2023

      • 커널 livepatch: 1.0-0.amzn2023

    • NVIDIA:

      • nvidia 컨테이너 툴킷: 1.17.8-1

      • nvidia 컨테이너 툴킷 기반: 1.17.8-1

      • libnvidia-container: 1.17.8-1(도구 포함)

      • nvidia 패브릭 관리자: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.32
  • Amazon Linux 2는 이제 더 이상 사용되지 않습니다. Kubernetes AMI는 AL2023을 기반으로 합니다.

  • NVIDIA SMI:

    • NVIDIA 드라이버 버전: 570.172.08

    • CUDA 버전: 12.8

  • 패키지:

    • 언어 및 코어 라이브러리:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • 코어 라이브러리:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ 유틸리티: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa 드라이버: 2.17.2-1.amzn2023

      • efa 구성: 1.18-1.amzn2023

      • efa nv 피어름: 1.2.2-1.amzn2023

      • efa 프로파일: 1.7-1.amzn2023

    • 커널:

      • 커널: 6.1.148-173.267.amzn2023

      • 커널 개발: 6.1.148-173.267.amzn2023

      • 커널 헤더: 6.1.148-173.267.amzn2023

      • 커널 도구: 6.1.148-173.267.amzn2023

      • 커널 모듈 추가: 6.1.148-173.267.amzn2023

      • 커널 livepatch: 1.0-0.amzn2023

    • NVIDIA:

      • nvidia 컨테이너 툴킷: 1.17.8-1

      • nvidia 컨테이너 툴킷 기반: 1.17.8-1

      • libnvidia-container: 1.17.8-1(도구 포함)

      • nvidia 패브릭 관리자: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.33

다음 표에는이 AMI 릴리스 및 해당 버전의 구성 요소에 대한 정보가 나와 있습니다.

component AL2023_x86 AL2023_arm64
EKS v1.33.4 v1.33.4
amazon-ssm-agent. 3.3.2299.0-1.amzn2023 3.3.2299.0-1.amzn2023
aws-neuronx-dkms 2.23.9.0-dkm 해당 사항 없음
containerd 1.7.27-1.eks.amzn2023.0.4 1.7.27-1.eks.amzn2023.0.4
efa 2.17.2-1.amzn2023 2.17.2-1.amzn2023
ena 2.14.1g 2.14.1g
kernel 6.12.40-64.114.amzn2023 해당 사항 없음
커널6.12 해당 사항 없음 6.12.40-64.114.amzn2023
kmod-nvidia-latest-dkms 570.172.08-1.amzn2023 570.172.08-1.el9
nvidia-container-toolkit 1.17.8-1 1.17.8-1
실행 1.2.6-1.amzn2023.0.1 1.2.6-1.amzn2023.0.1

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 8월 25일

Amazon EKS용 SageMaker HyperPod DLAMI 지원

다음은 이 릴리스의 업데이트 사항입니다.

Kubernetes v1.28

NVIDIA SMI:

  • Nvidia 드라이버 버전: 570.172.08

  • CUDA 버전: 12.8

추가된 패키지:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

업데이트된 패키지:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

제거된 패키지:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

리포지토리 변경됨:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.29

NVIDIA SMI:

  • Nvidia 드라이버 버전: 570.172.08

  • CUDA 버전: 12.8

추가된 패키지:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

업데이트된 패키지:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

제거된 패키지:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

리포지토리 변경됨:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.30

NVIDIA SMI:

  • Nvidia 드라이버 버전: 570.172.08

  • CUDA 버전: 12.8

추가된 패키지:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

업데이트된 패키지:

  • aws-neuronx-dkms.noarch: 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64: 1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

제거된 패키지:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

리포지토리 변경됨:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.31

NVIDIA SMI:

  • Nvidia 드라이버 버전: 570.172.08

  • CUDA 버전: 12.8

추가된 패키지:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

업데이트된 패키지:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

제거된 패키지:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

리포지토리 변경됨:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.32

NVIDIA SMI:

  • Nvidia 드라이버 버전: 570.172.08

  • CUDA 버전: 12.8

추가된 패키지:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

업데이트된 패키지:

  • aws-neuronx-dkms.noarch: 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64: 1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

제거된 패키지:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

리포지토리 변경됨:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 8월 12일

AMI에는 다음이 포함됩니다.

  • 지원되는 AWS서비스: Amazon EC2

  • 운영 체제: Amazon Linux 2023

  • 컴퓨팅 아키텍처: ARM64

  • 다음 패키지에 사용할 수 있는 최신 버전이 설치됩니다.

    • Linux 커널: 6.12

    • FSx Lustre

    • Docker

    • AWS CLI의 v2 /usr/bin/aws

    • NVIDIA DCGM

    • Nvidia 컨테이너 툴킷:

      • 버전 명령: nvidia-container-cli -V

    • Nvidia-docker2:

      • 버전 명령: nvidia-docker version

    • Nvidia-IMEX: v570.172.08-1

  • NVIDIA 드라이버: 570.158.01

  • NVIDIA CUDA 12.4, 12.5, 12.6, 12.8 스택:

    • CUDA, NCCL 및 cuDDN 설치 디렉터리: /usr/local/cuda-xx.x/

      • 예: /usr/local/cuda-12.8/, /usr/local/cuda-12.8/

    • 컴파일된 NCCL 버전:

      • 12.4의 CUDA 디렉터리의 경우 컴파일된 NCCL 버전 2.22.3+CUDA12.4

      • 12.5의 CUDA 디렉터리의 경우 컴파일된 NCCL 버전 2.22.3+CUDA12.5

      • 12.6의 CUDA 디렉터리의 경우 컴파일된 NCCL 버전 2.24.3+CUDA12.6

      • 12.8의 CUDA 디렉터리의 경우 컴파일된 NCCL 버전 2.27.5+CUDA12.8

    • 기본 CUDA: 12.8

      • PATH는 CUDA 12.8을 /usr/local/cuda 가리킵니다.

      • 아래 env vars가 업데이트되었습니다.

        • LD_LIBRARY_PATH를 사용하려면 /usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64

        • PATH를 사용하려면 /usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/

        • 다른 CUDA 버전의 경우 LD_LIBRARY_PATH 그에 따라 업데이트하세요.

  • EFA 설치 관리자: 1.42.0

  • Nvidia GDRCopy: 2.5.1

  • AWSOFI NCCL 플러그인은 EFA 설치 프로그램과 함께 제공됩니다.

    • /opt/amazon/ofi-nccl/lib 및 경로/opt/amazon/ofi-nccl/efa가에 추가됩니다LD_LIBRARY_PATH.

  • AWS CLI의 v2 /usr/local/bin/aws

  • EBS 볼륨 유형: gp3

  • Python: /usr/bin/python3.9

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 8월 6일

Amazon EKS용 SageMaker HyperPod DLAMI 지원

AMI에는 다음 업데이트가 포함됩니다.

K8s v1.28
  • Neuron 패키지:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.29
  • Neuron 패키지:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.30
  • Neuron 패키지:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.31
  • Neuron 패키지:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.32
  • Neuron 패키지:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

중요
  • Deep Learning Base OSS Nvidia Driver AMI(Amazon Linux 2) 버전 70.3

  • Deep Learning Base Proprietary Nvidia Driver AMI(Amazon Linux 2) 버전 68.4

  • 최신 CUDA 12.8 지원

  • Nvidia의 7월 Security Bulletin에 있는 CVE를 수정하기 위해 Nvidia 드라이버를 570.158.01에서 570.172.08로 업그레이드했습니다.

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 7월 31일

Amazon SageMaker HyperPod는 이제 기본 운영 체제를 Amazon Linux 2023으로 업데이트하는 Amazon EKS 클러스터용 새 AMI를 지원합니다. 이 릴리스는 Amazon Linux 2(AL2)의 몇 가지 개선 사항을 제공합니다. HyperPod는 새 AMI를 정기적으로 릴리스하므로 취약성을 해결하고 오래된 소프트웨어 및 라이브러리를 단계적으로 만료하기 위해 가장 안전한 최신 버전의 AMI에서 모든 HyperPod 클러스터를 실행하는 것이 좋습니다.

주요 업그레이드

  • 운영 체제: Amazon Linux 2023(Amazon Linux 2, 즉 AL2에서 업데이트됨)

  • 패키지 관리자: DNF는 AL2에 사용된 YUM을 대체하는 기본 패키지 관리 도구임

  • 네트워킹 서비스: systemd-networkd가 AL2에서 사용된 ISC dhclient를 대체하여 네트워크 인터페이스를 관리함

  • Linux 커널: 버전 6.1(AL2에 사용된 커널에서 업데이트됨)

  • Glibc: 버전 2.34(AL2의 버전에서 업데이트됨)

  • GCC: 버전 11.5.0(AL2의 버전에서 업데이트됨)

  • NFS: 버전 1:2.6.1(AL2의 버전 1:1.3.4에서 업데이트됨)

  • NVIDIA 드라이버: 버전 570.172.08(최신 드라이버 버전)

  • Python: 버전 3.9(AL2에서 사용된 Python 2.7 대체)

  • NVME: 버전 1.11.1(NVMe 드라이버의 최신 버전)

업그레이드 전에

업그레이드하기 전에 알아야 할 몇 가지 중요한 사항이 있습니다. AL2023은 AL2와 비교하여 여러 패키지가 추가, 업그레이드 또는 제거되었습니다. 클러스터를 업그레이드하기 전에 AL2023으로 애플리케이션을 테스트하는 것이 좋습니다. AL2023 패키지의 모든 변경 사항 목록은 Package changes in Amazon Linux 2023를 참조하세요.

다음은 AL2와 AL2023 간의 몇 가지 중요한 변경 사항입니다.

  • Python 3.10: 운영 체제 외에 가장 중요한 업데이트는 Python 버전 업그레이드입니다. 업그레이드 후 클러스터의 기본값은 Python 3.10입니다. 일부 Python 3.8 분산 훈련 워크로드는 Python 3.10과 호환될 수 있지만 특정 워크로드를 별도로 테스트하는 것이 좋습니다. Python 3.10으로 마이그레이션하는 것이 어렵지만 다른 새로운 기능을 위해 클러스터를 업그레이드하려는 경우 워크로드를 실행하기 전에 수명 주기 스크립트yum install python-xx.x 함께 명령을 사용하여 이전 Python 버전을 설치할 수 있습니다. 호환성을 위해 기존 수명 주기 스크립트와 애플리케이션 코드를 모두 테스트해야 합니다.

  • NVIDIA 런타임 적용: AL2023은 NVIDIA 컨테이너 런타임 요구 사항을 엄격하게 적용하여 하드 코딩된 NVIDIA 환경 변수(예: NVIDIA_VISIBLE_DEVICES: "all")가 있는 컨테이너가 CPU 전용 노드에서 실패하도록 합니다(AL2는 GPU 드라이버가 없는 경우 이러한 설정을 무시함). 포드 사양에서 NVIDIA_VISIBLE_DEVICES: "void"를 설정하거나 CPU 전용 이미지를 사용하여 적용을 재정의할 수 있습니다.

  • cgroup v2: AL2023에는 차세대 통합 제어 그룹 계층 구조(cgroup v2)가 있습니다. cgroup v2는 컨테이너 런타임에 사용되며 systemd에서도 사용됩니다. AL2023에 시스템이 cgroup v1을 사용하여 실행하도록 할 수 있는 코드가 여전히 포함되어 있지만 이 구성은 권장되지 않습니다.

  • Amazon VPC CNI 및 eksctl 버전: AL2023에서는 Amazon VPC CNI 버전이 1.16.2 이상이고 eksctl 버전이 0.176.0 이상이어야 합니다.

  • FSx for Lustre의 EFA: 이제 FSx for Lustre에서 EFA를 사용할 수 있습니다. 이를 통해 클라우드 컴퓨팅의 확장성, 유연성 및 탄력성을 활용하면서 온프레미스 AI/ML 또는 고성능 컴퓨팅(HPC) 클러스터와 비슷한 애플리케이션 성능을 달성할 수 있습니다.

또한 AL2023으로 업그레이드하려면 최소 1.0.643.0_1.0.192.0 버전의 상태 모니터링 에이전트가 필요합니다. 상태 모니터링 에이전트를 업데이트하려면 다음 절차를 완료하세요.

  1. GitHub 리포지토리 awsome-distributed-training에서 HyperPod 수명 주기 스크립트를 사용하는 경우 최신 버전을 가져와야 합니다. 이전 버전은 AL2023과 호환되지 않습니다. 새로운 수명 주기 스크립트는 containerd가 추가 탑재 스토리지를 사용하여 AL2023에서 컨테이너 이미지를 가져올 수 있도록 합니다.

  2. HyperPod CLI git 리포지토리의 최신 버전을 가져옵니다.

  3. helm dependencies update helm_chart/HyperPodHelmChart 명령을 사용하여 종속성을 업데이트합니다.

  4. HyperPodHelmChart의 README의 4단계에서 언급한 대로 helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system 명령을 실행하여 클러스터에서 실행되는 종속성 버전을 업그레이드합니다.

업그레이드된 EKS 클러스터에서 테스트된 워크로드

다음은 업그레이드를 테스트한 몇 가지 사용 사례입니다.

  • 이전 버전과의 호환성: PyTorch와 관련된 인기 있는 분산 훈련 작업은 새 AMI에서 이전 버전과 호환됩니다. 그러나 워크로드가 특정 Python 또는 Linux 라이브러리에 의존할 수 있으므로 더 큰 클러스터를 업그레이드하기 전에 먼저 더 작은 규모의 노드 또는 하위 집합으로 테스트하는 것이 좋습니다.

  • 액셀러레이터 테스트: NVIDIA 액셀러레이터(P 및 G 인스턴스 패밀리용)와 AWSNeuron 액셀러레이터(Trn 인스턴스용)를 모두 활용하는 다양한 인스턴스 유형의 작업이 테스트되었습니다.

AMI 및 관련 워크로드를 업그레이드하는 방법

다음 방법 중 하나를 사용하여 새로운 AMI로 업그레이드할 수 있습니다.

  • create-cluster API를 사용하여 최신 AMI로 새 클러스터를 생성합니다.

  • update-cluster-software API를 사용하여 기존 클러스터를 업그레이드합니다. 이 옵션은 모든 수명 주기 스크립트를 다시 실행합니다.

업데이트 프로세스 중에는 클러스터를 사용할 수 없습니다. 업그레이드가 완료된 후 이 가동 중지 시간을 계획하고 기존 체크포인트에서 훈련 워크로드를 다시 시작하는 것이 좋습니다. 모범 사례는 더 큰 클러스터를 업그레이드하기 전에 더 작은 클러스터에서 테스트를 수행하는 것입니다.

업데이트 명령이 실패하면 먼저 실패 원인을 식별합니다. 수명 주기 스크립트 실패의 경우 스크립트를 필요한 대로 수정하고 다시 시도합니다. 해결할 수 없는 다른 문제는 AWS Support에 문의하세요.

문제 해결

다음 섹션을 사용하면 AL2023으로 업그레이드할 때 발생하는 문제를 해결하는 데 도움이 됩니다.

CPU 전용 클러스터 노드의 "nvml error: driver not loaded: unknown"과 같은 오류를 해결하려면 어떻게 해야 하나요?

CPU AL2 Amazon EKS 노드에서 작동한 컨테이너가 이제 AL2023에서 실패하는 경우 컨테이너 이미지에 하드 코딩된 NVIDIA 환경 변수가 있을 수 있습니다. 다음 명령을 사용하여 하드 코딩된 환경 변수를 확인할 수 있습니다.

docker inspect image:tag | grep -i nvidia

AL2023은 이러한 요구 사항을 엄격하게 적용하는 반면 AL2는 CPU 전용 노드에서 더 관대했습니다. 한 가지 해결 방법은 다음 예시와 같이 Amazon EKS 포드 사양에서 특정 NVIDIA 환경 변수를 설정하여 AL2023 적용을 재정의하는 것입니다.

yaml containers: - name: your-container image: your-image:tag env: - name: NVIDIA_VISIBLE_DEVICES value: "void" - name: NVIDIA_DRIVER_CAPABILITIES value: ""

또 다른 대안은 CPU 전용 컨테이너 이미지(예: pytorch/pytorch:latest-cpu)를 사용하거나 NVIDIA 종속성 없이 사용자 지정 이미지를 구축하는 것입니다.

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 7월 15일

Amazon EKS용 SageMaker HyperPod DLAMI 지원

AMI에는 다음 업데이트가 포함됩니다.

K8s v1.28
  • 최신 NVIDIA 드라이버: 550.163.01

  • 기본 CUDA: 12.4

  • EFA 설치 관리자: 1.38.0

  • Neuron 패키지:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.29
  • Nvidia 드라이버 버전: 550.163.01

  • CUDA 버전: 12.4

  • EFA 설치 관리자: 1.38.0

  • Neuron 패키지:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.30
  • Nvidia 드라이버 버전: 550.163.01

  • CUDA 버전: 12.4

  • EFA 설치 관리자 버전: 1.38.0

  • Neuron 패키지:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.31
  • Nvidia 드라이버 버전: 550.163.01

  • CUDA 버전: 12.4

  • EFA 설치 관리자 버전: 1.38.0

  • Neuron 패키지:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.32
  • Nvidia 드라이버 버전: 550.163.01

  • CUDA 버전: 12.4

  • EFA 설치 관리자 버전: 1.38.0

  • Neuron 패키지:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 6월 9일

Amazon EKS용 SageMaker HyperPod DLAMI 지원

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.21.37.0(2.20.74.0에서 업데이트)

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 5월 22일

AMI 일반 업데이트

Amazon EKS용 SageMaker HyperPod DLAMI 지원

Deep Learning Base AMI AL2
  • 최신 NVIDIA 드라이버: 550.163.01

  • CUDA 스택 업데이트:

    • 기본 CUDA: 12.1

    • NCCL 버전: 2.22.3

  • EFA 설치 관리자: 1.38.0

  • AWSOFI NCCL: 1.13.2

  • Linux 커널: 5.10

  • GDRCopy : 2.4

중요
  • NVIDIA Container Toolkit 1.17.4 업데이트: 이제 CUDA 호환 라이브러리 탑재를 비활성화했습니다.

  • 1.37에서 1.38로 EFA 업데이트:

    • AWSOFI NCCL 플러그인이 이제 /opt/amazon/ofi-nccl에 위치함

    • 이전 위치 /opt/aws-ofi-nccl/은 더 이상 사용되지 않습니다.

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0(2.20.28.0에서 업데이트)

  • aws-neuronx-collectives.x86_64: 2.25.65.0_9858ac9a1-1(2.24.59.0_838c7fc8b-1에서 업데이트)

  • aws-neuronx-runtime-lib.x86_64: 2.25.57.0_166c7a468-1(2.24.53.0_f239092cc-1에서 업데이트)

  • aws-neuronx-tools.x86_64: 2.23.9.0(2.22.61.0에서 업데이트)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0(0.14.12.0에서 업데이트)

  • aws-neuronx-gpsimd-tools.x86_64: 0.15.1.0_5d31b6a3f(0.14.6.0_241eb69f4에서 업데이트)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0(2.24.23.0에서 업데이트)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0(2.24.23.0에서 업데이트)

지원 정보:

  • 프레임워크 지원 정책에 따라 CUDA 버전을 포함한 AMI 구성 요소가 제거되거나 변경될 수 있습니다.

  • 커널 버전은 호환성을 위해 고정되어 있습니다. 사용자는 보안 패치에 필요하지 않은 한 업데이트를 피해야 합니다.

  • 네트워크 카드가 여러 개인 EC2 인스턴스의 경우 적절한 설정은 EFA 구성 가이드를 참조하세요.

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 5월 7일

Installed the latest version ofAWSNeuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neuron

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 4월 28일

K8s 개선 사항

  • NVIDIA 드라이버를 버전 550.144.03에서 버전 550.163.01로 업그레이드했습니다. 이 업그레이드는 2025년 4월 NVIDIA GPU Display Security Bulletin에 있는 일반적인 취약성 및 노출(CVE)을 해결하기 위한 것입니다.

Amazon EKS용 SageMaker HyperPod DLAMI 지원

Installed the latest version ofAWSNeuron SDK
  • aws-neuronx-dkms.noarch: 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

  • aws-neuronx-tools.x86_64: 2.18.3.0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64: 2.24.59.0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.14.12.0-1

  • aws-neuronx-gpsimd-tools.x86_64: 0.14.6.0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64: 2.24.23.0-1

  • aws-neuronx-k8-scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64: 2.24.53.0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2.22.61.0-1

  • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 4월 18일

AMI 일반 업데이트

  • Amazon EKS 1.32.1용 새로운 SageMaker HyperPod AMI

Amazon EKS용 SageMaker HyperPod DLAMI 지원

AMI에는 다음이 포함됩니다.

Deep Learning EKS AMI 1.32.1
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.32.1

    • Containerd 버전: 1.7.27

    • Runc 버전: 1.1.14

    • AWSIAM 인증자: 0.6.29

  • Amazon SSM Agent: 3.3.1611.0

  • Linux 커널: 5.10.235

  • OSS Nvidia 드라이버: 550.163.01

  • NVIDIA CUDA: 12.4

  • EFA 설치 관리자: 1.38.0

  • GDRCopy: 2.4.1-1

  • Nvidia 컨테이너 도구 키트: 1.17.6

  • AWSOFI NCCL: 1.13.2

  • aws-neuronx-tools: 2.18.3.0

  • aws-neuronx-runtime-lib: 2.24.53.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.20.28.0

  • aws-neuronx-collectives: 2.24.59.0

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 2월 18일

K8s 개선 사항

  • Nvidia 컨테이너 도구 키트를 버전 1.17.3에서 버전 1.17.4로 업그레이드했습니다.

  • 재부팅 후 고객이 노드에 연결할 수 없는 문제를 수정했습니다.

  • Elastic Fabric Adapter(EFA) 버전을 1.37.0에서 1.38.0으로 업그레이드했습니다.

  • 이제 EFA에 원본 /opt/aws-ofi-nccl/ 경로 대신 /opt/amazon/ofi-nccl 디렉터리에 있는 AWSOFI NCCL 플러그인이 포함됩니다. LD_LIBRARY_PATH 환경 변수를 업데이트해야 하는 경우 OFI NCCL 플러그인의 새 /opt/amazon/ofi-nccl 위치를 가리키도록 경로를 수정해야 합니다.

  • 이러한 DLAMI에서 emacs 패키지를 제거했습니다. GNU emac에서 emacs을 설치할 수 있습니다.

Amazon EKS용 SageMaker HyperPod DLAMI 지원

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64: 2.18.3.0-1 @neuron

  • aws-neuronx-collectives.x86_64: 2.23.135.0_3e70920f2-1 neuron

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1 neuron

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64: 0.13.2.0_94ba34927-1 neuron

  • aws-neuronx-k8-plugin.x86_64: 2.23.45.0-1 neuron

  • aws-neuronx-k8-scheduler.x86_64: 2.23.45.0-1 neuron

  • aws-neuronx-runtime-lib.x86_64: 2.23.112.0_9b5179492-1 neuron

  • aws-neuronx-tools.x86_64: 2.20.204.0-1 neuron

  • tensorflow-model-server-neuronx.x86_64

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2025년 1월 22일

AMI 일반 업데이트

  • Amazon EKS 1.31.2용 새로운 SageMaker HyperPod AMI

Amazon EKS용 SageMaker HyperPod DLAMI 지원

AMI에는 다음이 포함됩니다.

Deep Learning EKS AMI 1.31
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.31.2

    • Containerd 버전: 1.7.23

    • Runc 버전: 1.1.14

    • AWSIAM 인증자: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux 커널: 5.10.230

  • OSS Nvidia 드라이버: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA 설치 관리자: 1.37.0

  • GDRCopy: 2.4.1-1

  • Nvidia 컨테이너 도구 키트: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.133.0

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 12월 21일

Amazon EKS용 SageMaker HyperPod DLAMI 지원

AMI에는 다음이 포함됩니다.

K8s v1.28
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.28.15

    • Containerd 버전: 1.7.23

    • Runc 버전: 1.1.14

    • AWSIAM 인증자: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux 커널: 5.10.228

  • OSS NVIDIA 드라이버: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA 설치 관리자: 1.37.0

  • GDRCopy : 2.4

  • NVIDIA 컨테이너 도구 키트: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.29
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.29.10

    • Containerd 버전: 1.7.23

    • Runc 버전: 1.1.14

    • AWSIAM 인증자: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux 커널: 5.15.0

  • OSS Nvidia 드라이버: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA 설치 관리자: 1.37.0

  • GDRCopy : 2.4

  • Nvidia 컨테이너 도구 키트: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.30
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.30.6

    • Containerd 버전: 1.7.23

    • Runc 버전: 1.1.14

    • AWSIAM 인증자: 0.6.26

  • Amazon SSM Agent: 3.3.987.0

  • Linux 커널: 5.10.228

  • OSS Nvidia 드라이버: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA 설치 관리자: 1.37.0

  • GDRCopy : 2.4

  • Nvidia 컨테이너 도구 키트: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 12월 13일

Amazon EKS용 SageMaker HyperPod DLAMI 업그레이드

  • SSM Agent를 버전 3.3.1311.0으로 업데이트했습니다.

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 11월 24일

AMI 일반 업데이트

  • MEL(멜버른) 리전에서 릴리스했습니다.

  • SageMaker HyperPod 기본 DLAMI를 다음 버전으로 업데이트했습니다.

    • Kubernetes: 2024-11-01

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 11월 15일

Amazon EKS용 SageMaker HyperPod DLAMI 지원

AMI에는 다음이 포함됩니다.

Deep Learning EKS AMI 1.28
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.28.15

    • Containerd 버전: 1.7.23

    • Runc 버전: 1.1.14

    • AWSIAM 인증자: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux 커널: 5.10.228

  • OSS NVIDIA 드라이버: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA 설치 관리자: 1.34.0

  • GDRCopy : 2.4

  • NVIDIA 컨테이너 도구 키트: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.29
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.29.10

    • Containerd 버전: 1.7.23

    • Runc 버전: 1.1.14

    • AWSIAM 인증자: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux 커널: 5.10.228

  • OSS Nvidia 드라이버: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA 설치 관리자: 1.34.0

  • GDRCopy : 2.4

  • Nvidia 컨테이너 도구 키트: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.30
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.30.6

    • Containerd 버전: 1.7.23

    • Runc 버전: 1.1.14

    • AWSIAM 인증자: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux 커널: 5.10.228

  • OSS Nvidia 드라이버: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA 설치 관리자: 1.34.0

  • GDRCopy : 2.4

  • Nvidia 컨테이너 도구 키트: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 11월 11일

AMI 일반 업데이트

  • Amazon EKS 버전 1.28.13, 1.29.8, 1.30.4로 SageMaker HyperPod DLAMI를 업데이트했습니다.

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 10월 21일

AMI 일반 업데이트

  • SageMaker HyperPod 기본 DLAMI를 다음 버전으로 업데이트했습니다.

    • Amazon EKS: 1.28.11, 1.29.6, 1.30.2

Amazon EKS용 SageMaker HyperPod AMI 릴리스: 2024년 9월 10일

Amazon EKS용 SageMaker HyperPod DLAMI 지원

AMI에는 다음이 포함됩니다.

Deep Learning EKS AMI 1.28
  • Amazon EKS 구성 요소

    • Kubernetes 버전 1.28.11

    • 컨테이너 버전: 1.7.20

    • Runc 버전: 1.1.11

    • AWSIAM 인증자: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux 커널: 5.10.223

  • OSS NVIDIA 드라이버: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA 설치 관리자: 1.32.0

  • GDRCopy : 2.4

  • NVIDIA 컨테이너 툴킷: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.29
  • Amazon EKS 구성 요소

    • Kubernetes 버전 1.29.6

    • 컨테이너 버전: 1.7.20

    • Runc 버전: 1.1.11

    • AWSIAM 인증자: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux 커널: 5.10.223

  • OSS Nvidia 드라이버: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA 설치 관리자: 1.32.0

  • GDRCopy : 2.4

  • Nvidia 컨테이너 툴킷: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.30
  • Amazon EKS 구성 요소

    • Kubernetes 버전: 1.30.2

    • 컨테이너 버전: 1.7.20

    • Runc 버전: 1.1.11

    • AWSIAM 인증자: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux 커널: 5.10.223

  • OSS Nvidia 드라이버: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA 설치 관리자: 1.32.0

  • GDRCopy : 2.4

  • Nvidia 컨테이너 툴킷: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0