Amazon EKS 向け SageMaker HyperPod AMI リリース - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon EKS 向け SageMaker HyperPod AMI リリース

次のリリースノートは、Amazon EKS オーケストレーション向け Amazon SageMaker HyperPod AMI リリースの最新情報を提供します。以下の各リリースノートには、Amazon EKS 用 SageMaker HyperPod DLAMI のサポートにプリインストールまたは事前設定されているパッケージを要約したリストが記載されています。各 DLAMI は AL2023 上に構築されており、特定の Kubernetes バージョンをサポートしています。Slurm オーケストレーション用 HyperPod DLAMI リリースについては、「Slurm 向け SageMaker HyperPod AMI リリース」を参照してください。Amazon SageMaker HyperPod の機能リリースについては、「Amazon SageMaker HyperPod リリースノート」を参照してください。

Amazon EKS の SageMaker Hyperpod AMI リリース: 2025 年 11 月 22 日

AMI の一般的な更新

  • Amazon EKS バージョン 1.28、1.29、1.30、1.31、1.32、1.33 用の SageMaker Hyperpod AMI の更新をリリースしました。

  • 基本 DLAMI リリースノートは、こちらで入手できます。

SageMaker Hyperpod DLAMI for Amazon EKS サポート

このリリースでは、以下が更新されています。

Kubernetes v1.28
  • AL2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • Linux カーネルバージョン: 5.10

    • Glibc バージョン: 2.26

    • OpenSSL バージョン: 1.0.2k-fips

    • FSx Lustre クライアントバージョン: 2.12.8

    • Docker バージョン: Docker バージョン 25.0.13、ビルド 0bab007

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws CLI v2 バージョン: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 570.195.03

    • CUDA バージョン: 12.2

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.7.16

    • Kubernetes バージョン: v1.28.15-eks-473151a

    • iptables-services バージョン: 1.8.4

    • nginx バージョン: 1.20.1

    • nvme-cli バージョン: 1.11.1

    • epel-release バージョン: 7

    • ストレスバージョン: 1.0.4

    • collectd バージョン: 5.8.1

    • acl バージョン: 2.2.51

    • rsyslog バージョン: 8.24.0

    • lustre-client バージョン: 2.12.8

    • systemd バージョン: 219

    • openssh バージョン: 7.4

    • sudo バージョン: 1.8.23

    • gcc バージョン: 7.3.1

    • cmake バージョン: 2.8.12.2

    • git バージョン: 2.47.3

    • make バージョン: 3.82

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 1.3.0

    • lvm2 バージョン: 2.02.187

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

  • AL2023 (x86_64):

    • Linux カーネルバージョン: 6.1

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.28.15-eks-473151a

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

Kubernetes v1.29
  • AL2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • Linux カーネルバージョン: 5.10

    • Glibc バージョン: 2.26

    • OpenSSL バージョン: 1.0.2k-fips

    • FSx Lustre クライアントバージョン: 2.12.8

    • Docker バージョン: Docker バージョン 25.0.13、ビルド 0bab007

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws CLI v2 バージョン: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 570.195.03

    • CUDA バージョン: 12.2

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.7.16

    • Kubernetes バージョン: v1.29.15-eks-473151a

    • iptables-services バージョン: 1.8.4

    • nginx バージョン: 1.20.1

    • nvme-cli バージョン: 1.11.1

    • epel-release バージョン: 7

    • ストレスバージョン: 1.0.4

    • collectd バージョン: 5.8.1

    • acl バージョン: 2.2.51

    • rsyslog バージョン: 8.24.0

    • lustre-client バージョン: 2.12.8

    • systemd バージョン: 219

    • openssh バージョン: 7.4

    • sudo バージョン: 1.8.23

    • gcc バージョン: 7.3.1

    • cmake バージョン: 2.8.12.2

    • git バージョン: 2.47.3

    • make バージョン: 3.82

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 1.3.0

    • lvm2 バージョン: 2.02.187

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

  • AL2023 (x86_64):

    • Linux カーネルバージョン: 6.1

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.29.15-eks-473151a

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

Kubernetes v1.30
  • AL2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • Linux カーネルバージョン: 5.10

    • Glibc バージョン: 2.26

    • OpenSSL バージョン: 1.0.2k-fips

    • FSx Lustre クライアントバージョン: 2.12.8

    • Docker バージョン: Docker バージョン 25.0.13、ビルド 0bab007

    • Runc バージョン: 1.3.2

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws CLI v2 バージョン: aws-cli/1.42.69 Python/3.10.17 Linux/5.10.245-241.976.amzn2.x86_64 botocore/1.40.69

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 570.195.03

    • CUDA バージョン: 12.2

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.7.16

    • Kubernetes バージョン: v1.30.11-eks-473151a

    • iptables-services バージョン: 1.8.4

    • nginx バージョン: 1.20.1

    • nvme-cli バージョン: 1.11.1

    • epel-release バージョン: 7

    • ストレスバージョン: 1.0.4

    • collectd バージョン: 5.8.1

    • acl バージョン: 2.2.51

    • rsyslog バージョン: 8.24.0

    • lustre-client バージョン: 2.12.8

    • systemd バージョン: 219

    • openssh バージョン: 7.4

    • sudo バージョン: 1.8.23

    • gcc バージョン: 7.3.1

    • cmake バージョン: 2.8.12.2

    • git バージョン: 2.47.3

    • make バージョン: 3.82

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 1.3.0

    • lvm2 バージョン: 2.02.187

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 58。

  • AL2023 (x86_64):

    • Linux カーネルバージョン: 6.1

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.30.11-eks-473151a

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

Kubernetes v1.31
  • AL2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • Linux カーネルバージョン: 5.10

    • Glibc バージョン: 2.26

    • OpenSSL バージョン: 1.0.2k-fips

    • FSx Lustre クライアントバージョン: 2.12.8

    • Docker バージョン: Docker バージョン 25.0.13、ビルド 0bab007

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws CLI v2 バージョン: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 570.195.03

    • CUDA バージョン: 12.2

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.7.16

    • Kubernetes バージョン: v1.31.7-eks-473151a

    • iptables-services バージョン: 1.8.4

    • nginx バージョン: 1.20.1

    • nvme-cli バージョン: 1.11.1

    • epel-release バージョン: 7

    • ストレスバージョン: 1.0.4

    • collectd バージョン: 5.8.1

    • acl バージョン: 2.2.51

    • rsyslog バージョン: 8.24.0

    • lustre-client バージョン: 2.12.8

    • systemd バージョン: 219

    • openssh バージョン: 7.4

    • sudo バージョン: 1.8.23

    • gcc バージョン: 7.3.1

    • cmake バージョン: 2.8.12.2

    • git バージョン: 2.47.3

    • make バージョン: 3.82

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 1.3.0

    • lvm2 バージョン: 2.02.187

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

  • AL2023 (x86_64):

    • Linux カーネルバージョン: 6.1

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.31.13-eks-113cf36

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

  • AL2023 (ARM64):

    • Linux カーネルバージョン: 6.12

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.31.13-eks-113cf36

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • nvidia-imex バージョン: 580.95.05

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 58。

Kubernetes v1.32
  • AL2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • Linux カーネルバージョン: 5.10

    • Glibc バージョン: 2.26

    • OpenSSL バージョン: 1.0.2k-fips

    • FSx Lustre クライアントバージョン: 2.12.8

    • Docker バージョン: Docker バージョン 25.0.13、ビルド 0bab007

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws CLI v2 バージョン: aws-cli/1.42.74 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.74

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 570.195.03

    • CUDA バージョン: 12.2

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.7.16

    • Kubernetes バージョン: v1.32.3-eks-473151a

    • iptables-services バージョン: 1.8.4

    • nginx バージョン: 1.20.1

    • nvme-cli バージョン: 1.11.1

    • epel-release バージョン: 7

    • ストレスバージョン: 1.0.4

    • collectd バージョン: 5.8.1

    • acl バージョン: 2.2.51

    • rsyslog バージョン: 8.24.0

    • lustre-client バージョン: 2.12.8

    • systemd バージョン: 219

    • openssh バージョン: 7.4

    • sudo バージョン: 1.8.23

    • gcc バージョン: 7.3.1

    • cmake バージョン: 2.8.12.2

    • git バージョン: 2.47.3

    • make バージョン: 3.82

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 1.3.0

    • lvm2 バージョン: 2.02.187

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

  • AL2023 (x86_64):

    • Linux カーネルバージョン: 6.1

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.32.9-eks-113cf36

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

  • AL2023 (ARM64):

    • Linux カーネルバージョン: 6.12

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.32.9-eks-113cf36

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • nvidia-imex バージョン: 580.95.05

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 58。

Kubernetes v1.33
  • AL2023 (x86_64):

    • Linux カーネルバージョン: 6.1

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • aws Neuronx DKMS バージョン: 2.24.7.0

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.33.5-eks-113cf36

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 59。

  • AL2023 (ARM64):

    • Linux カーネルバージョン: 6.12

    • Glibc バージョン: 2.34

    • OpenSSL バージョン: 3.2.2

    • FSx Lustre クライアントバージョン: 2.15.6

    • Runc バージョン: 1.3.3

    • Containerd バージョン: containerd github.com/containerd/containerd 1.7.27

    • NVIDIA ドライバーのバージョン: 580.95.05

    • CUDA バージョン: 12.8

    • ENA ドライバーバージョン: 2.15.0g

    • Python バージョン: 3.9.24

    • Kubernetes バージョン: v1.33.5-eks-113cf36

    • iptables-services バージョン: 1.8.8

    • nginx バージョン: 1.28.0

    • nvme-cli バージョン: 2.13 1.13

    • ストレスバージョン: 1.0.7

    • collectd バージョン: 5.12.0。

    • acl バージョン: 2.3.1

    • lustre-client バージョン: 2.15.6

    • nvidia-imex バージョン: 580.95.05

    • systemd バージョン: 252

    • openssh バージョン: 8.7

    • sudo バージョン: 1.9.15

    • gcc バージョン: 11.5.0

    • cmake バージョン: 3.22.2

    • git バージョン: 2.50.1

    • make バージョン: 4.3

    • cloudwatch-agent バージョン: 1.300060.1

    • nfs-utils バージョン: 2.5.4

    • lvm2 バージョン: 2.03.16

    • ec2-instance-connect バージョン: 1.1

    • aws-cfn-bootstrap バージョン: 2.0

    • rdma-core バージョン: 58。

Amazon EKS の SageMaker HyperPod AMI リリース: 2025 年 11 月 7 日

AMI の一般的な更新

  • Amazon EKS バージョン 1.28、1.29、1.30、1.31、1.32、および 1.33 用の SageMaker HyperPod AMI の更新をリリースしました。

  • 基本 DLAMI リリースノートは、こちらで入手できます。

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

このリリースでは、以下が更新されています。

Kubernetes v1.28
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.28.15

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.28.15

  • パッケージの更新には、boto3、botocore、pip、regex、psutil、nvidia コンテナツールキットコンポーネントが含まれます。

  • 追加されたパッケージ: annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.29.15

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.29.15

  • パッケージの更新には、カーネルの更新、glibc の更新、さまざまなシステムライブラリが含まれます。

  • 追加されたパッケージ: annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.30.11

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.30.11

  • パッケージの更新には、カーネル livepatch の更新とシステムライブラリの更新が含まれます。

  • 追加されたパッケージ: annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.31.7

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.31.13

  • AL2023 (アーム):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.31.13

    • カーネルバージョン: 6.12.46-66.121.amzn2023.aarch64

  • パッケージの更新には、広範なシステムライブラリの更新、カーネルの更新、ライブラリの更新のブーストが含まれます。

  • 追加されたパッケージ: apr-util-lmdb、kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.32.3

    • AWSIAM Authenticator バージョン: v0.6.29

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.32.9

  • AL2023 (アーム):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.32.9

    • カーネルバージョン: 6.12.46-66.121.amzn2023.aarch64

  • パッケージの更新には、カーネル livepatch の更新とシステムライブラリの更新が含まれます。

  • 追加されたパッケージ: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.33.5

    • カーネルバージョン: 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (アーム):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.33.5

    • カーネルバージョン: 6.12.46-66.121.amzn2023.aarch64

  • パッケージの更新には、広範なシステムライブラリの更新、カーネルの更新、ライブラリの更新のブーストが含まれます。

  • パッケージの追加: apr-util-lmdb、kernel-livepatch の更新

注記

runc バージョンが 1.3.2 セキュリティ情報にアップグレードされました

Amazon EKS の SageMaker HyperPod AMI リリース: 2025 年 10 月 29 日

AMI の一般的な更新

  • Amazon EKS バージョン 1.28、1.29、1.30、1.31、1.32、および 1.33 用の SageMaker HyperPod AMI の更新をリリースしました。

  • 基本 DLAMI リリースノートは、こちらで入手できます。

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

このリリースでは、以下が更新されています。

Kubernetes v1.28
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.28.15

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.28.15

  • パッケージの更新には、boto3、botocore、pip、regex、psutil、nvidia コンテナツールキットコンポーネントが含まれます。

  • 追加されたパッケージ: annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.29.15

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.29.15

  • パッケージの更新には、カーネルの更新、glibc の更新、さまざまなシステムライブラリが含まれます。

  • 追加されたパッケージ: annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.30.11

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.30.11

  • パッケージの更新には、カーネル livepatch の更新とシステムライブラリの更新が含まれます。

  • 追加されたパッケージ: annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.31.7

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.31.13

  • AL2023 (アーム):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.31.13

    • カーネルバージョン: 6.12.46-66.121.amzn2023.aarch64

  • パッケージの更新には、広範なシステムライブラリの更新、カーネルの更新、ライブラリの更新のブーストが含まれます。

  • 追加されたパッケージ: apr-util-lmdb、kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • AL2 (x86_64):

    • NVIDIA ドライバーバージョン: 570.195.03

    • CUDA バージョン: 12.8

    • Kubernetes バージョン: 1.32.3

  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.32.9

  • AL2023 (アーム):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.32.9

    • カーネルバージョン: 6.12.46-66.121.amzn2023.aarch64

  • パッケージの更新には、カーネル livepatch の更新とシステムライブラリの更新が含まれます。

  • 追加されたパッケージ: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.33.5

    • カーネルバージョン: 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (アーム):

    • NVIDIA ドライバーバージョン: 580.95.05

    • CUDA バージョン: 13.0

    • Kubernetes バージョン: 1.33.5

    • カーネルバージョン: 6.12.46-66.121.amzn2023.aarch64

  • パッケージの更新には、広範なシステムライブラリの更新、カーネルの更新、ライブラリの更新のブーストが含まれます。

  • パッケージの追加: apr-util-lmdb、kernel-livepatch の更新

Amazon EKS の SageMaker HyperPod AMI リリース: 2025 年 10 月 22 日

AL2x86

注記

Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

基本 DLAMI リリースノートは、こちらで入手できます。

  • EKS バージョン 1.28~1.32

  • このリリースには、Nvidia October Security Bulletin にある、影響を受ける NVIDIA ドライバーパッケージの CVE パッチが含まれています。

  • NVIDIA SMI

    NVIDIA-SMI 570.195.03 Driver Version: 570.195.03 CUDA Version: 12.8
  • メジャーバージョン

    パッケージ名 バージョン
    framework_version 70
    gdr_copy 2.4.1
    supported_ec2_instances G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_driver 570.195.03
    python_location /usr/bin/python3.10
    nvidia_cuda_stack /usr/local/cuda-12.1、/usr/local/cuda-12.2、/usr/local/cuda-12.3、/usr/local/cuda-12.4
    ssm_agent_version 3.3.3050.0
    kernel_version 5.10.244-240.965.amzn2.x86_64
    nvidia_container_toolkit_version 1.17.8
    ofi_nccl_version 1.16.3
    operating_system Amazon Linux 2
    default_cuda /usr/local/cuda-12.1/
    compute_architecture x86_64
  • パッケージの追加: このリリースではパッケージは追加されませんでした。

  • 更新されたパッケージ

    パッケージ名 以前のバージョン 新しいバージョン
    boto3 1.40.46 1.40.49
    botocore 1.40.46 1.40.49
    fastapi 0.118.0 0.118.2
    ファイルロック 3.19.1 3.20.0
    importlib_metadata 8.7.0 8.0.0
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    matplotlib 3.10.6 3.10.7
    パッケージング 25 24.2
    platformdirs 4.4.0 4.5.0
    propcache 0.4.0 0.4.1
    リッチ 14.1.0 14.2.0
    トムリ語 2.2.1 2.3.0
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    virtualenv 20.34.0 20.35.1
    websocket-client 1.8.0 1.9.0
  • 削除されたパッケージ: このリリースではパッケージは削除されませんでした。

AL2023x86

基本 DLAMI リリースノートは、こちらで入手できます。

  • EKS バージョン 1.28~1.32。EKS バージョン 1.33 のリリースはありません。

  • このリリースには、Nvidia October Security Bulletin にある、影響を受ける NVIDIA ドライバーパッケージの CVE パッチが含まれています。

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • メジャーバージョン

    パッケージ名 バージョン
    gdr_copy 2.5.1
    supported_ec2_instances G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_gds_version 1.15.0.42
    nvidia_driver 580.95.05
    python_location /usr/bin/python3.9
    nvidia_cuda_stack /usr/local/cuda-12.6、/usr/local/cuda-12.8、/usr/local/cuda-12.9、/usr/local/cuda-13.0
    ssm_agent_version 3.3.3050.0
    kernel_version 6.1.153-175.280.amzn2023.x86_64
    nvidia_container_toolkit_version 1.17.8
    dcgm_version 4.4.1
    ofi_nccl_version 1.16.3
    operating_system Amazon Linux 2023.9.20250929
    default_cuda /usr/local/cuda-12.9/
    compute_architecture x86_64
  • パッケージの追加: このリリースではパッケージは追加されませんでした。

  • 更新されたパッケージ

    パッケージ名 以前のバージョン 新しいバージョン
    boto3 1.40.46 1.40.49
    botocore 1.40.46 1.40.49
    fastapi 0.118.0 0.118.2
    gdrcopy 2.5-1 2.5.1-1
    gdrcopy-devel 2.5-1 2.5.1-1
    gdrcopy-kmod 2.5~1 km 2.5.1~1dkm
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    more-itertools 10.8.0 10.3.0
    パッケージング 25 24.2
    propcache 0.4.0 0.4.1
    自然 2.11.10 2.12.0
    pydantic_core 2.33.2 2.41.1
    リッチ 14.1.0 14.2.0
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    typing_extensions 4.12.2 4.15.0
    virtualenv 20.34.0 20.35.1
    websocket-client 1.8.0 1.9.0
  • 削除されたパッケージ: このリリースではパッケージは削除されませんでした。

AL2023 ARM64

基本 DLAMI リリースノートは、こちらで入手できます。

  • EKS バージョン 1.31~1.33。

  • このリリースには、Nvidia October Security Bulletin に記載されている、影響を受ける NVIDIA ドライバーパッケージの CVE パッチが含まれています。

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • メジャーバージョン

    パッケージ名 バージョン
    gdr_copy 2.5
    supported_ec2_instances G5g, P6e-GB200
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_driver 580.95.05
    python_location /usr/bin/python3.9
    nvidia_cuda_stack /usr/local/cuda-12.6、/usr/local/cuda-12.8、/usr/local/cuda-12.9、/usr/local/cuda-13.0
    ssm_agent_version 3.3.3050.0
    kernel_version 6.12.46-66.121.amzn2023.aarch64
    nvidia_container_toolkit_version 1.17.8
    dcgm_version 4.4.1
    ofi_nccl_version 1.16.3
    オペレーティングシステム Amazon Linux 2023.9.20250929
    default_cuda /usr/local/cuda-12.9/
    compute_architecture AARCH64
  • パッケージの追加: このリリースではパッケージは追加されませんでした。

  • 更新されたパッケージ

    パッケージ名 以前のバージョン 新しいバージョン
    aiohttp 3.12.15 3.13.0
    属性 25.3.0 25.4.0
    boto3 1.40.45 1.40.49
    botocore 1.40.45 1.40.49
    cattrs 25.2.0 25.3.0
    証明書 2025.8.3 2025.10.5
    efa 2.17.2-1.amzn2023 2.17.3-1.amzn2023
    fastapi 0.118.0 0.118.2
    フリーズリスト 1.7.0 1.8.0
    importlib_metadata 8.7.0 8.0.0
    jaraco.context 5.3.0 6.0.1
    マルチディクト 6.6.4 6.7.0
    ナジラ 2.6.0 2.7.0
    nh3 0.3.0 0.3.1
    propcache 0.3.2 0.4.1
    自然 2.11.9 2.12.0
    pydantic_core 2.33.2 2.41.1
    pylint 3.3.8 3.3.9
    python-json-logger 3.3.0 4.0.0
    リッチ 14.1.0 14.2.0
    トムリ語 2.2.1 2.0.1
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    virtualenv 20.34.0 20.35.1
    websocket-client 1.8.0 1.9.0
    yarl 1.20.1 1.22.0
    zipp 3.19.2 3.23.0
  • 削除されたパッケージ: このリリースではパッケージは削除されませんでした。

Amazon EKS の SageMaker HyperPod AMI リリース: 2025 年 9 月 29 日

AMI の一般的な更新

  • Amazon EKS 1.33 用の新しい SageMaker HyperPod AMI をリリースしました。詳細については、「Amazon EKS の SageMaker HyperPod AMI リリース: 2025 年 9 月 29 日」を参照してください。

    重要
    • 動的リソース割り当てベータ Kubernetes API は、このリリースではデフォルトで有効になっています。

      • この API は、GPUs。

      • この API はオープンソースの Kubernetes コミュニティによって開発され、Kubernetes の将来のバージョンで変更される可能性があります。API を使用する前に、Kubernetes ドキュメントを確認し、それがワークロードにどのように影響するかを理解してください。

    • HyperPod は、HyperPod Amazon Linux 2 AMI for Kubernetes 1.33 をリリースしていません。AL2023 に移行AWSすることをお勧めします。詳細については、「Amazon Linux 2 から AL2023 へのアップグレード」を参照してください。

詳細については、「Kubernetes v1.33」を参照してください。

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

このリリースでは、以下が更新されています。

Kubernetes v1.28
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • NVIDIA SMI:

    • NVIDIA ドライバーバージョン: 570.172.08

    • CUDA バージョン: 12.8

  • パッケージ:

    • 言語とコアライブラリ:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • コアライブラリ:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ Utils: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa ドライバー: 2.17.2-1.amzn2023

      • efa 設定: 1.18-1.amzn2023

      • efa nv peermem: 1.2.2-1.amzn2023

      • efa プロファイル: 1.7-1.amzn2023

    • カーネル:

      • カーネル: 6.1.148-173.267.amzn2023

      • カーネル開発: 6.1.148-173.267.amzn2023

      • カーネルヘッダー: 6.1.148-173.267.amzn2023

      • カーネルツール: 6.1.148-173.267.amzn2023

      • カーネルモジュールの追加: 6.1.148-173.267.amzn2023

      • カーネル livepatch: 1.0-0.amzn2023

    • Nvidia:

      • nvidia コンテナツールキット: 1.17.8-1

      • nvidia コンテナツールキットベース: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (ツールを使用)

      • nvidia ファブリックマネージャー: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.29
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • NVIDIA SMI:

    • NVIDIA ドライバーバージョン: 570.172.08

    • CUDA バージョン: 12.8

  • パッケージ:

    • 言語とコアライブラリ:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • コアライブラリ:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ Utils: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa ドライバー: 2.17.2-1.amzn2023

      • efa 設定: 1.18-1.amzn2023

      • efa nv peermem: 1.2.2-1.amzn2023

      • efa プロファイル: 1.7-1.amzn2023

    • カーネル:

      • カーネル: 6.1.148-173.267.amzn2023

      • カーネル開発: 6.1.148-173.267.amzn2023

      • カーネルヘッダー: 6.1.148-173.267.amzn2023

      • カーネルツール: 6.1.148-173.267.amzn2023

      • カーネルモジュールの追加: 6.1.148-173.267.amzn2023

      • カーネル livepatch: 1.0-0.amzn2023

    • Nvidia:

      • nvidia コンテナツールキット: 1.17.8-1

      • nvidia コンテナツールキットベース: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (ツールを使用)

      • nvidia ファブリックマネージャー: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.30
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • NVIDIA SMI:

    • NVIDIA ドライバーバージョン: 570.172.08

    • CUDA バージョン: 12.8

  • パッケージ:

    • 言語とコアライブラリ:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • コアライブラリ:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ Utils: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa ドライバー: 2.17.2-1.amzn2023

      • efa 設定: 1.18-1.amzn2023

      • efa nv peermem: 1.2.2-1.amzn2023

      • efa プロファイル: 1.7-1.amzn2023

    • カーネル:

      • カーネル: 6.1.148-173.267.amzn2023

      • カーネル開発: 6.1.148-173.267.amzn2023

      • カーネルヘッダー: 6.1.148-173.267.amzn2023

      • カーネルツール: 6.1.148-173.267.amzn2023

      • カーネルモジュールの追加: 6.1.148-173.267.amzn2023

      • カーネル livepatch: 1.0-0.amzn2023

    • Nvidia:

      • nvidia コンテナツールキット: 1.17.8-1

      • nvidia コンテナツールキットベース: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (ツールを使用)

      • nvidia ファブリックマネージャー: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.31
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • NVIDIA SMI:

    • NVIDIA ドライバーバージョン: 570.172.08

    • CUDA バージョン: 12.8

  • パッケージ:

    • 言語とコアライブラリ:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • コアライブラリ:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ Utils: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa ドライバー: 2.17.2-1.amzn2023

      • efa 設定: 1.18-1.amzn2023

      • efa nv peermem: 1.2.2-1.amzn2023

      • efa プロファイル: 1.7-1.amzn2023

    • カーネル:

      • カーネル: 6.1.148-173.267.amzn2023

      • カーネル開発: 6.1.148-173.267.amzn2023

      • カーネルヘッダー: 6.1.148-173.267.amzn2023

      • カーネルツール: 6.1.148-173.267.amzn2023

      • カーネルモジュールの追加: 6.1.148-173.267.amzn2023

      • カーネル livepatch: 1.0-0.amzn2023

    • Nvidia:

      • nvidia コンテナツールキット: 1.17.8-1

      • nvidia コンテナツールキットベース: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (ツールを使用)

      • nvidia ファブリックマネージャー: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.32
  • Amazon Linux 2 は廃止されました。Kubernetes AMI は AL2023 に基づいています。

  • NVIDIA SMI:

    • NVIDIA ドライバーバージョン: 570.172.08

    • CUDA バージョン: 12.8

  • パッケージ:

    • 言語とコアライブラリ:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14: 14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Go: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • コアライブラリ:

      • GlibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ Utils: 5.2.5-9.amzn2023.0.2

      • Util-linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • efa ドライバー: 2.17.2-1.amzn2023

      • efa 設定: 1.18-1.amzn2023

      • efa nv peermem: 1.2.2-1.amzn2023

      • efa プロファイル: 1.7-1.amzn2023

    • カーネル:

      • カーネル: 6.1.148-173.267.amzn2023

      • カーネル開発: 6.1.148-173.267.amzn2023

      • カーネルヘッダー: 6.1.148-173.267.amzn2023

      • カーネルツール: 6.1.148-173.267.amzn2023

      • カーネルモジュールの追加: 6.1.148-173.267.amzn2023

      • カーネル livepatch: 1.0-0.amzn2023

    • Nvidia:

      • nvidia コンテナツールキット: 1.17.8-1

      • nvidia コンテナツールキットベース: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (ツールを使用)

      • nvidia ファブリックマネージャー: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.33

次の表に、この AMI リリース内のコンポーネントと、対応するバージョンに関する情報を示します。

コンポーネント AL2023_x86 AL2023_arm64
EKS v1.33.4 v1.33.4
amazon-ssm-agent 3.3.2299.0-1.amzn2023 3.3.2299.0-1.amzn2023
aws-neuronx-dkms 2.23.9.0-dkms 該当なし
containerd 1.7.27-1.eks.amzn2023.0.4 1.7.27-1.eks.amzn2023.0.4
efa 2.17.2-1.amzn2023 2.17.2-1.amzn2023
ena 2.14.1g 2.14.1g
kernel 6.12.40-64.114.amzn2023 該当なし
kernel6.12 該当なし 6.12.40-64.114.amzn2023
kmod-nvidia-latest-dkms 570.172.08-1.amzn2023 570.172.08-1.el9
nvidia-container-toolkit 1.17.8-1 1.17.8-1
ランタイム 1.2.6-1.amzn2023.0.1 1.2.6-1.amzn2023.0.1

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 8 月 25 日

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

このリリースでは、以下が更新されています。

Kubernetes v1.28

NVIDIA SMI:

  • NVIDIA ドライバーバージョン: 570.172.08

  • CUDA バージョン:12.8

追加されたパッケージ:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

更新されたパッケージ:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

削除されたパッケージ:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

リポジトリの変更:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.29

NVIDIA SMI:

  • NVIDIA ドライバーバージョン: 570.172.08

  • CUDA バージョン:12.8

追加されたパッケージ:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

更新されたパッケージ:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

削除されたパッケージ:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

リポジトリの変更:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.30

NVIDIA SMI:

  • NVIDIA ドライバーバージョン: 570.172.08

  • CUDA バージョン:12.8

追加されたパッケージ:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

更新されたパッケージ:

  • aws-neuronx-dkms.noarch: 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64: 1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

削除されたパッケージ:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

リポジトリの変更:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.31

NVIDIA SMI:

  • NVIDIA ドライバーバージョン: 570.172.08

  • CUDA バージョン:12.8

追加されたパッケージ:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

更新されたパッケージ:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

削除されたパッケージ:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

リポジトリの変更:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.32

NVIDIA SMI:

  • NVIDIA ドライバーバージョン: 570.172.08

  • CUDA バージョン:12.8

追加されたパッケージ:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

更新されたパッケージ:

  • aws-neuronx-dkms.noarch: 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64: 1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

削除されたパッケージ:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

リポジトリの変更:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Amazon EKS の SageMaker HyperPod AMI リリース: 2025 年 8 月 12 日

AMI には以下が含まれます。

  • サポートされているAWSサービス: Amazon EC2

  • オペレーティングシステム: Amazon Linux 2023

  • コンピューティングアーキテクチャ: ARM64

  • 利用可能な最新バージョンは、次のパッケージにインストールされます。

    • Linux カーネル: 6.12

    • FSx Lustre

    • Docker

    • AWS CLIでの v2 /usr/bin/aws

    • NVIDIA DCGM

    • NVIDIA Container Toolkit:

      • Version コマンド: nvidia-container-cli -V

    • Nvidia-docker2:

      • Version コマンド: nvidia-docker version

    • Nvidia-IMEX: v570.172.08-1

  • NVIDIA ドライバー: 570.158.01

  • NVIDIA CUDA 12.4、12.5、12.6、12.8 スタック:

    • CUDA、NCCL、および cuDDN インストールディレクトリ: /usr/local/cuda-xx.x/

      • 例: /usr/local/cuda-12.8//usr/local/cuda-12.8/

    • コンパイルされた NCCL バージョン:

      • 12.4 の CUDA ディレクトリの場合、コンパイルされた NCCL バージョン 2.22.3+CUDA12.4

      • 12.5 の CUDA ディレクトリの場合、コンパイルされた NCCL バージョン 2.22.3+CUDA12.5

      • 12.6 の CUDA ディレクトリの場合、コンパイルされた NCCL バージョン 2.24.3+CUDA12.6

      • 12.8 の CUDA ディレクトリの場合、コンパイルされた NCCL バージョン 2.27.5+CUDA12.8

    • デフォルトの CUDA: 12.8

      • PATH /usr/local/cudaが CUDA 12.8 を指す

      • 以下の環境変数が更新されました。

        • LD_LIBRARY_PATH を持つには /usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64

        • PATH を持つには /usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/

        • 別の CUDA バージョンについては、LD_LIBRARY_PATHそれに応じて更新してください。

  • EFA インストーラ: 1.42.0

  • Nvidia GDRCopy: 2.5.1

  • AWSOFI NCCL プラグインに EFA インストーラが付属

    • パス/opt/amazon/ofi-nccl/lib/opt/amazon/ofi-nccl/efaが に追加されますLD_LIBRARY_PATH

  • AWS CLIでの v2 /usr/local/bin/aws

  • EBS ボリュームタイプ: gp3

  • Python: /usr/bin/python3.9

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 8 月 6 日

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

AMI には次の更新が含まれています。

K8s v1.28
  • Neuron パッケージ:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.29
  • Neuron パッケージ:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.30
  • Neuron パッケージ:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.31
  • Neuron パッケージ:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.32
  • Neuron パッケージ:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

重要
  • Deep Learning Base OSS Nvidia ドライバー AMI (Amazon Linux 2) バージョン 70.3

  • Deep Learning Base Proprietary Nvidia ドライバー AMI (Amazon Linux 2) バージョン 68.4

  • CUDA 12.8 サポートの最新情報

  • 7 月の Nvidia セキュリティ情報に記載の CVE を修正するために、Nvidia ドライバーを 570.158.01 から 570.172.08 にアップグレードしました。

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 7 月 31 日

Amazon SageMaker HyperPod は、ベースオペレーティングシステムを Amazon Linux 2023 に更新する Amazon EKS クラスターの新しい AMI をサポートするようになりました。このリリースでは、Amazon Linux 2 (AL2) からいくつかの改善が追加されています。HyperPod は新しい AMIs を定期的にリリースします。脆弱性に対処し、古いソフトウェアやライブラリを段階的に廃止するために、すべての HyperPod クラスターを最新の最も安全なバージョンの AMI で実行することをお勧めします。

主なアップグレード

  • オペレーティングシステム: Amazon Linux 2023 (Amazon Linux 2 または AL2 から更新)

  • パッケージマネージャー: DNF はデフォルトのパッケージ管理ツールであり、AL2 で使用される YUM を置き換えます

  • ネットワークサービス: systemd-networkd はネットワークインターフェイスを管理し、AL2 で使用される ISC dhclient を置き換えます

  • Linux カーネル: バージョン 6.1、AL2 で使用されるカーネルから更新

  • Glibc: バージョン 2.34、AL2 で使用されるバージョンから更新

  • GCC: バージョン 11.5.0、AL2 でのバージョンから更新

  • NFS: バージョン 1:2.6.1、1:1.3.4 in AL2 での バージョン 1:1.3.4 から更新

  • NVIDIA ドライバー: バージョン 570.172.08、新しいドライバーバージョン

  • Python: バージョン 3.9、AL2 で使用される Python 2.7 を置き換え

  • NVME: バージョン 1.11.1、NVMe ドライバーの新しいバージョン

アップグレード前の注意点

アップグレードする前に知っておくべき重要な点がいくつかあります。AL2023 では、AL2 と比較して複数のパッケージが追加、アップグレード、または削除されています。クラスターをアップグレードする前に、AL2023 でアプリケーションをテストすることを強くお勧めします。AL2023 のパッケージに関するすべての変更一覧については、「Amazon Linux 2023 パッケージの変更点」を参照してください。

AL2 と AL2023 の重要な変更点を以下にいくつか紹介します。

  • Python 3.10: オペレーティングシステム以外の最も重要な更新は、Python バージョンのアップグレードです。アップグレード後、クラスターのデフォルトは Python 3.10 になります。一部の Python 3.8 分散トレーニングワークロードは Python 3.10 と互換性がある場合がありますが、特定のワークロードを個別にテストすることを強くお勧めします。Python 3.10 への移行が困難な場合でも、クラスターを他の新機能にアップグレードする場合は、ワークロードを実行する前にライフサイクルスクリプトyum install python-xx.xで コマンドを使用して古い Python バージョンをインストールできます。既存のライフサイクルスクリプトとアプリケーションコードの両方の互換性をテストしてください。

  • NVIDIA ランタイムの適用: AL2023 は NVIDIA コンテナランタイム要件を厳密に適用し、ハードコードされた NVIDIA 環境変数 (NVIDIA_VISIBLE_DEVICES: "all" など) を持つコンテナは CPU 専用ノードで失敗します (GPU ドライバーが存在しない場合、AL2 はこれらの設定を無視します)。ポッド仕様で NVIDIA_VISIBLE_DEVICES: "void" を設定するか、CPU 専用イメージを使用して、強制を上書きできます。

  • cgroup v2: AL2023 は次世代の統合コントロールグループ階層 (cgroup v2) を備えています。cgroup v2 はコンテナランタイムに使用され、systemd でも使用されます。AL2023 には、cgroup v1 を使用してシステムを実行できるコードがまだ含まれていますが、これは推奨される設定ではありません。

  • Amazon VPC CNI および eksctl のバージョン: AL2023 では、Amazon VPC CNI のバージョンが 1.16.2 以降、eksctl のバージョンが 0.176.0 以降である必要があります。

  • FSx for Lustre での EFA: FSx for Lustre で EFA を使用できるようになりました。これにより、クラウドコンピューティングのスケーラビリティ、柔軟性、伸縮性を活用しながら、オンプレミスの AI/ML または HPC (ハイパフォーマンスコンピューティング) クラスターと同等のアプリケーションパフォーマンスを実現できます。

さらに、AL2023 にアップグレードするには、1.0.643.0_1.0.192.0 以降のバージョンの Health Monitoring Agent が必要です。Health Monitoring Agent を更新するには、次の手順を実行します。

  1. GitHub リポジトリ awsome-distributed-training から HyperPod ライフサイクルスクリプトを使用する場合は、必ず最新バージョンをプルしてください。以前のバージョンは AL2023 と互換性がありません。新しいライフサイクルスクリプトにより、containerd は追加のマウントストレージを使用して AL2023 のコンテナイメージをプルします。

  2. HyperPod CLI git リポジトリの最新バージョンをプルします。

  3. 依存関係を更新するには、helm dependencies update helm_chart/HyperPodHelmChart コマンドを使用します。

  4. HyperPodHelmChart の README のステップ 4 に記載のとおり、クラスターで実行されている依存関係のバージョンをアップグレードするには、helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system コマンドを実行します。

アップグレードされた EKS クラスターでテスト済みのワークロード

アップグレードがテストされたユースケースをいくつか紹介します。

  • 後方互換性: PyTorch を使用する一般的な分散トレーニングジョブは、新しい AMI でも後方互換性があるはずです。ただし、ワークロードが特定の Python または Linux ライブラリに依存している可能性があるため、大規模なクラスターをアップグレードする前に、まず小規模なノードまたは一部のノードでテストすることをお勧めします。

  • アクセラレーターテスト: NVIDIA アクセラレーター (P および G インスタンスファミリーの場合) と AWSNeuron アクセラレーター (Trn インスタンスの場合) の両方を利用した、さまざまなインスタンスタイプのジョブがテストされています。

AMI と関連するワークロードをアップグレードする方法

新しい AMI へのアップグレードは、以下のいずれかの方法で行うことができます。

  • create-cluster API を使用して、最新の AMI で新しいクラスターを作成します。

  • update-cluster-software API を使用して、既存のクラスターをアップグレードします。このオプションの場合、ライフサイクルスクリプトが再実行されることに注意が必要です。

更新プロセス中はクラスターは使用できません。このダウンタイムを想定して、アップグレード完了後に既存のチェックポイントからトレーニングワークロードを再開することをお勧めします。ベストプラクティスとして、大規模なクラスターをアップグレードする前に、小規模なクラスターでテストを行うことをお勧めします。

update コマンドが失敗した場合、まず失敗の原因を特定します。ライフサイクルスクリプトが失敗した場合は、スクリプトに必要な修正を加えて再試行します。解決できないその他の問題については、AWS サポートにお問い合わせください。

トラブルシューティング

AL2023 へのアップグレード時に発生した問題のトラブルシューティングについては、以下のセクションを参照してください。

CPU のみのクラスターノードで "nvml error: driver not loaded: unknown" などのエラーを修正するにはどうすればよいですか。

CPU AL2 Amazon EKS ノードでは動作していたコンテナが AL2023 では動作しなくなる場合、コンテナイメージに NVIDIA 環境変数がハードコードされている可能性があります。次のコマンドを使用すると、ハードコードされた環境変数を確認できます。

docker inspect image:tag | grep -i nvidia

AL2023 はこれらの要件を厳密に適用しますが、AL2 は CPU のみのノードではより寛容でした。解決策の 1 つは、次の例に示されるとおり、Amazon EKS ポッド仕様で特定の NVIDIA 環境変数を設定することで、AL2023 の適用をオーバーライドすることです。

yaml containers: - name: your-container image: your-image:tag env: - name: NVIDIA_VISIBLE_DEVICES value: "void" - name: NVIDIA_DRIVER_CAPABILITIES value: ""

もう 1 つの方法は、CPU のみのコンテナイメージ (pytorch/pytorch:latest-cpu など) を使用するか、NVIDIA の依存関係なしでカスタムイメージを構築することです。

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 7 月 15 日

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

AMI には次の更新が含まれています。

K8s v1.28
  • 最新の NVIDIA ドライバー: 550.163.01

  • デフォルトの CUDA: 12.4

  • EFA インストーラ: 1.38.0

  • Neuron パッケージ:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.29
  • Nvidia ドライバーバージョン: 550.163.01

  • CUDA バージョン: 12.4

  • EFA インストーラ: 1.38.0

  • Neuron パッケージ:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.30
  • Nvidia ドライバーバージョン: 550.163.01

  • CUDA バージョン: 12.4

  • EFA インストーラバージョン: 1.38.0

  • Neuron パッケージ:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.31
  • Nvidia ドライバーバージョン: 550.163.01

  • CUDA バージョン: 12.4

  • EFA インストーラバージョン: 1.38.0

  • Neuron パッケージ:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.32
  • Nvidia ドライバーバージョン: 550.163.01

  • CUDA バージョン: 12.4

  • EFA インストーラバージョン: 1.38.0

  • Neuron パッケージ:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 6 月 9 日

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.21.37.0 (2.20.74.0 から)

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 5 月 22 日

AMI の一般的な更新

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

Deep Learning Base AMI AL2
  • 最新の NVIDIA ドライバー: 550.163.01

  • CUDA スタックの更新:

    • デフォルトの CUDA: 12.1

    • NCCL バージョン: 2.22.3

  • EFA インストーラ: 1.38.0

  • AWSOFI NCCL: 1.13.2

  • Linux カーネル: 5.10

  • GDRCopy: 2.4

重要
  • NVIDIA Container Toolkit 1.17.4 の更新: CUDA互換ライブラリのマウントが無効になりました

  • EFA の 1.37 から 1.38 への更新:

    • AWSOFI NCCL プラグインが /opt/amazon/ofi-nccl に配置されるようになりました

    • 以前の場所 /opt/aws-ofi-nccl/ は廃止されました

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (2.20.28.0 から)

  • aws-neuronx-collectives.x86_64: 2.25.65.0_9858ac9a1-1 (2.24.59.0_838c7fc8b-1 から)

  • aws-neuronx-runtime-lib.x86_64: 2.25.57.0_166c7a468-1 (2.24.53.0_f239092cc-1 から)

  • aws-neuronx-tools.x86_64: 2.23.9.0 (2.22.61.0 から)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (0.14.12.0 から)

  • aws-neuronx-gpsimd-tools.x86_64: 0.15.1.0_5d31b6a3f (0.14.6.0_241eb69f4 から)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (2.24.23.0 から)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (2.24.23.0 から)

サポートの注意点:

  • CUDA バージョンを含む AMI コンポーネントは、フレームワークのサポートポリシーに基づいて削除または変更される場合があります。

  • カーネルバージョンは、互換性のために固定されるようになりました。セキュリティパッチが必要な場合を除き、ユーザーは更新を避ける必要があります。

  • 複数のネットワークカードを備えた EC2 インスタンスの場合、適切な設定については EFA 設定ガイドを参照してください。

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 5 月 7 日

Installed the latest version ofAWSNeuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neuron

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 4 月 28 日

K8 の改善点

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

Installed the latest version ofAWSNeuron SDK
  • aws-neuronx-dkms.noarch: 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

  • aws-neuronx-tools.x86_64: 2.18.3.0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64: 2.24.59.0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.14.12.0-1

  • aws-neuronx-gpsimd-tools.x86_64: 0.14.6.0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64: 2.24.23.0-1

  • aws-neuronx-k8-scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64: 2.24.53.0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2.22.61.0-1

  • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 4 月 18 日

AMI の一般的な更新

  • Amazon EKS 1.32.1 用の新しい SageMaker HyperPod AMI

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

AMI には次のものが含まれています。

Deep Learning EKS AMI 1.32.1
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.32.1

    • コンテナバージョン: 1.7.27

    • Runc バージョン: 1.1.14

    • AWSIAM Authenticator: 0.6.29

  • Amazon SSM Agent: 3.3.1611.0

  • Linux カーネル: 5.10.235

  • OSS Nvidia ドライバー: 550.163.01

  • NVIDIA CUDA: 12.4

  • EFA インストーラ: 1.38.0

  • GDRCopy: 2.4.1-1

  • Nvidia コンテナツールキット: 1.17.6

  • AWSOFI NCCL: 1.13.2

  • aws-neuronx-tools: 2.18.3.0

  • aws-neuronx-runtime-lib: 2.24.53.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.20.28.0

  • aws-neuronx-collectives: 2.24.59.0

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 2 月 18 日

K8 の改善点

  • NVIDIA コンテナツールキットをバージョン 1.17.3 からバージョン 1.17.4 にアップグレードしました。

  • 再起動後にお客様がノードに接続できなかった問題を修正しました。

  • Elastic Fabric Adapter (EFA) バージョンを 1.37.0 から 1.38.0 にアップグレードしました。

  • EFA に、元の/opt/aws-ofi-nccl/パスではなく /opt/amazon/ofi-nccl ディレクトリにある AWSOFI NCCL プラグインが含まれるようになりました。LD_LIBRARY_PATH 環境変数を更新する必要がある場合は、OFI NCCL プラグインの新しい /opt/amazon/ofi-nccl の場所を指すようにパスを変更してください。

  • これらの DLAMI から emacs パッケージを削除しました。GNU emac から emac をインストールできるようになりました。

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64: 2.18.3.0-1 @neuron

  • aws-neuronx-collectives.x86_64: 2.23.135.0_3e70920f2-1 neuron

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1 neuron

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64: 0.13.2.0_94ba34927-1 neuron

  • aws-neuronx-k8-plugin.x86_64: 2.23.45.0-1 neuron

  • aws-neuronx-k8-scheduler.x86_64: 2.23.45.0-1 neuron

  • aws-neuronx-runtime-lib.x86_64: 2.23.112.0_9b5179492-1 neuron

  • aws-neuronx-tools.x86_64: 2.20.204.0-1 neuron

  • tensorflow-model-server-neuronx.x86_64

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 1 月 22 日

AMI の一般的な更新

  • Amazon EKS 1.31.2 用の新しい SageMaker HyperPod AMI

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

AMI には次のものが含まれています。

Deep Learning EKS AMI 1.31
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.31.2

    • コンテナバージョン: 1.7.23

    • Runc バージョン: 1.1.14

    • AWSIAM Authenticator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux カーネル: 5.10.230

  • OSS Nvidia ドライバー: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA インストーラ: 1.37.0

  • GDRCopy: 2.4.1-1

  • Nvidia コンテナツールキット: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.133.0

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 12 月 21 日

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

AMI には次のものが含まれています。

K8s v1.28
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.28.15

    • コンテナバージョン: 1.7.23

    • Runc バージョン: 1.1.14

    • AWSIAM Authenticator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux カーネル: 5.10.228

  • OSS NVIDIA ドライバー: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA インストーラ: 1.37.0

  • GDRCopy: 2.4

  • NVIDIA コンテナツールキット: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.29
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.29.10

    • コンテナバージョン: 1.7.23

    • Runc バージョン: 1.1.14

    • AWSIAM Authenticator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux カーネル: 5.15.0

  • OSS Nvidia ドライバー: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA インストーラ: 1.37.0

  • GDRCopy: 2.4

  • Nvidia コンテナツールキット: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.30
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.30.6

    • コンテナバージョン: 1.7.23

    • Runc バージョン: 1.1.14

    • AWSIAM Authenticator: 0.6.26

  • Amazon SSM Agent: 3.3.987.0

  • Linux カーネル: 5.10.228

  • OSS Nvidia ドライバー: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA インストーラ: 1.37.0

  • GDRCopy: 2.4

  • Nvidia コンテナツールキット: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 12 月 13 日

Amazon EKS 向け SageMaker HyperPod DLAMI リリースアップグレード

  • SSM エージェントをバージョン 3.3.1311.0 に更新しました。

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 24 日

AMI の一般的な更新

  • MEL (メルボルン) リージョンでリリースされました。

  • SageMaker HyperPod ベース DLAMI を次のバージョンに更新しました。

    • Kubernetes: 2024-11-01

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 15 日

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

AMI には次のものが含まれています。

Deep Learning EKS AMI 1.28
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.28.15

    • コンテナバージョン: 1.7.23

    • Runc バージョン: 1.1.14

    • AWSIAM Authenticator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux カーネル: 5.10.228

  • OSS NVIDIA ドライバー: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA インストーラ: 1.34.0

  • GDRCopy: 2.4

  • NVIDIA コンテナツールキット: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.29
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.29.10

    • コンテナバージョン: 1.7.23

    • Runc バージョン: 1.1.14

    • AWSIAM Authenticator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux カーネル: 5.10.228

  • OSS Nvidia ドライバー: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA インストーラ: 1.34.0

  • GDRCopy: 2.4

  • Nvidia コンテナツールキット: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.30
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.30.6

    • コンテナバージョン: 1.7.23

    • Runc バージョン: 1.1.14

    • AWSIAM Authenticator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux カーネル: 5.10.228

  • OSS Nvidia ドライバー: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA インストーラ: 1.34.0

  • GDRCopy: 2.4

  • Nvidia コンテナツールキット: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 11 日

AMI の一般的な更新

  • SageMaker HyperPod DLAMI を Amazon EKS バージョン 1.28.13、1.29.8、1.30.4 で更新しました。

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 10 月 21 日

AMI の一般的な更新

  • SageMaker HyperPod ベース DLAMI を次のバージョンに更新しました。

    • Amazon EKS: 1.28.11、1.29.6、1.30.2

Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 9 月 10 日

Amazon EKS 用 SageMaker HyperPod DLAMI のサポート

AMI には次のものが含まれています。

Deep Learning EKS AMI 1.28
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.28.11

    • コンテナバージョン: 1.7.20

    • Runc バージョン: 1.1.11

    • AWSIAM Authenticator: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux カーネル: 5.10.223

  • OSS NVIDIA ドライバー: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA インストーラ: 1.32.0

  • GDRCopy: 2.4

  • NVIDIA コンテナツールキット: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.29
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.29.6

    • コンテナバージョン: 1.7.20

    • Runc バージョン: 1.1.11

    • AWSIAM Authenticator: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux カーネル: 5.10.223

  • OSS Nvidia ドライバー: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA インストーラ: 1.32.0

  • GDRCopy: 2.4

  • Nvidia コンテナツールキット: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.30
  • Amazon EKS コンポーネント

    • Kubernetes バージョン: 1.30.2

    • コンテナバージョン: 1.7.20

    • Runc バージョン: 1.1.11

    • AWSIAM Authenticator: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux カーネル: 5.10.223

  • OSS Nvidia ドライバー: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA インストーラ: 1.32.0

  • GDRCopy: 2.4

  • Nvidia コンテナツールキット: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0