SageMaker HyperPod Versioni AMI per Amazon EKS - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker HyperPod Versioni AMI per Amazon EKS

Le seguenti note di rilascio tengono traccia degli ultimi aggiornamenti per le versioni di Amazon SageMaker HyperPod AMI per l'orchestrazione di Amazon EKS. Ogni nota di versione include un elenco riepilogativo dei pacchetti preinstallati o preconfigurati nel supporto per SageMaker HyperPod DLAMIs Amazon EKS. Ogni DLAMI è basato su AL2 023 e supporta una versione specifica di Kubernetes. Per le versioni HyperPod DLAMI per l'orchestrazione di Slurm, vedere. SageMaker HyperPod Rilasci AMI per Slurm Per informazioni sulle versioni delle SageMaker HyperPod funzionalità di Amazon, consultaNote di SageMaker HyperPod rilascio di Amazon.

SageMaker Rilasci AMI Hyperpod per Amazon EKS: 22 novembre 2025

Aggiornamenti generali AMI

SageMaker Supporto Hyperpod DLAMI per Amazon EKS

Questo rilascio include gli aggiornamenti seguenti:

Kubernetes v1.28
  • AL2 ora è obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del kernel Linux: 5.10

    • Versione Glibc: 2.26

    • Versione OpenSSL: 1.0.2k-fips

    • FSx Versione Lustre Client: 2.12.8

    • Versione Docker: versione Docker 25.0.13, build 0bab007

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • versione di aws CLI v2: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.2

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.7.16

    • Versione Kubernetes: v1.28.15-eks-473151a

    • versione iptables-services: 1.8.4

    • versione nginx: 1.20.1

    • versione nvme-cli: 1.11.1

    • versione epel-release: 7

    • versione antistress: 1.0.4

    • versione raccolta: 5.8.1

    • versione acl: 2.2.51

    • versione rsyslog: 8.24.0

    • versione lustre-client: 2.12.8

    • versione systemd: 219

    • versione openssh: 7.4

    • versione sudo: 1.8.23

    • versione gcc: 7.3.1

    • versione cmake: 2.8.12.2

    • versione git: 2.47.3

    • crea versione: 3.82

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 1.3.0

    • versione lvm2:2.02.187

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

  • AL2023 (x86_64):

    • Versione del kernel Linux: 6.1

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.28.15-eks-473151a

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

Kubernetes v1.29
  • AL2 ora è obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del kernel Linux: 5.10

    • Versione Glibc: 2.26

    • Versione OpenSSL: 1.0.2k-fips

    • FSx Versione Lustre Client: 2.12.8

    • Versione Docker: versione Docker 25.0.13, build 0bab007

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • versione di aws CLI v2: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.2

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.7.16

    • Versione Kubernetes: v1.29.15-eks-473151a

    • versione iptables-services: 1.8.4

    • versione nginx: 1.20.1

    • versione nvme-cli: 1.11.1

    • versione epel-release: 7

    • versione antistress: 1.0.4

    • versione raccolta: 5.8.1

    • versione acl: 2.2.51

    • versione rsyslog: 8.24.0

    • versione lustre-client: 2.12.8

    • versione systemd: 219

    • versione openssh: 7.4

    • versione sudo: 1.8.23

    • versione gcc: 7.3.1

    • versione cmake: 2.8.12.2

    • versione git: 2.47.3

    • crea versione: 3.82

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 1.3.0

    • versione lvm2:2.02.187

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

  • AL2023 (x86_64):

    • Versione del kernel Linux: 6.1

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.29.15-eks-473151a

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

Kubernetes v1.30
  • AL2 ora è obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del kernel Linux: 5.10

    • Versione Glibc: 2.26

    • Versione OpenSSL: 1.0.2k-fips

    • FSx Versione Lustre Client: 2.12.8

    • Versione Docker: versione Docker 25.0.13, build 0bab007

    • Versione runc: 1.3.2

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • versione di aws CLI v2: aws-cli/1.42.69 Python/3.10.17 Linux/5.10.245-241.976.amzn2.x86_64 botocore/1.40.69

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.2

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.7.16

    • Versione Kubernetes: v1.30.11-eks-473151a

    • versione iptables-services: 1.8.4

    • versione nginx: 1.20.1

    • versione nvme-cli: 1.11.1

    • versione epel-release: 7

    • versione antistress: 1.0.4

    • versione raccolta: 5.8.1

    • versione acl: 2.2.51

    • versione rsyslog: 8.24.0

    • versione lustre-client: 2.12.8

    • versione systemd: 219

    • versione openssh: 7.4

    • versione sudo: 1.8.23

    • versione gcc: 7.3.1

    • versione cmake: 2.8.12.2

    • versione git: 2.47.3

    • crea versione: 3.82

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 1.3.0

    • versione lvm2:2.02.187

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 58.

  • AL2023 (x86_64):

    • Versione del kernel Linux: 6.1

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.30.11-eks-473151a

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

Kubernetes v1.31
  • AL2 ora è obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del kernel Linux: 5.10

    • Versione Glibc: 2.26

    • Versione OpenSSL: 1.0.2k-fips

    • FSx Versione Lustre Client: 2.12.8

    • Versione Docker: versione Docker 25.0.13, build 0bab007

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • versione di aws CLI v2: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.2

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.7.16

    • Versione Kubernetes: v1.31.7-eks-473151a

    • versione iptables-services: 1.8.4

    • versione nginx: 1.20.1

    • versione nvme-cli: 1.11.1

    • versione epel-release: 7

    • versione antistress: 1.0.4

    • versione raccolta: 5.8.1

    • versione acl: 2.2.51

    • versione rsyslog: 8.24.0

    • versione lustre-client: 2.12.8

    • versione systemd: 219

    • versione openssh: 7.4

    • versione sudo: 1.8.23

    • versione gcc: 7.3.1

    • versione cmake: 2.8.12.2

    • versione git: 2.47.3

    • crea versione: 3.82

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 1.3.0

    • versione lvm2:2.02.187

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

  • AL2023 (x86_64):

    • Versione del kernel Linux: 6.1

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.31.13-eks-113cf36

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

  • AL2023 (2): ARM64

    • Versione del Kernel Linux: 6.12

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.31.13-eks-113cf36

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione nvidia-imex: 580.95.05

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 58.

Kubernetes v1.32
  • AL2 ora è obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del kernel Linux: 5.10

    • Versione Glibc: 2.26

    • Versione OpenSSL: 1.0.2k-fips

    • FSx Versione Lustre Client: 2.12.8

    • Versione Docker: versione Docker 25.0.13, build 0bab007

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • versione di aws CLI v2: aws-cli/1.42.74 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.74

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.2

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.7.16

    • Versione Kubernetes: v1.32.3-eks-473151a

    • versione iptables-services: 1.8.4

    • versione nginx: 1.20.1

    • versione nvme-cli: 1.11.1

    • versione epel-release: 7

    • versione antistress: 1.0.4

    • versione raccolta: 5.8.1

    • versione acl: 2.2.51

    • versione rsyslog: 8.24.0

    • versione lustre-client: 2.12.8

    • versione systemd: 219

    • versione openssh: 7.4

    • versione sudo: 1.8.23

    • versione gcc: 7.3.1

    • versione cmake: 2.8.12.2

    • versione git: 2.47.3

    • crea versione: 3.82

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 1.3.0

    • versione lvm2:2.02.187

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

  • AL2023 (x86_64):

    • Versione del kernel Linux: 6.1

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.32.9-eks-113cf36

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

  • AL2023 (2): ARM64

    • Versione del Kernel Linux: 6.12

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.32.9-eks-113cf36

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione nvidia-imex: 580.95.05

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 58.

Kubernetes v1.33
  • AL2023 (x86_64):

    • Versione del kernel Linux: 6.1

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione DKMS di aws Neuronx: 2.24.7.0

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.33.5-eks-113cf36

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 59.

  • AL2023 (2): ARM64

    • Versione del Kernel Linux: 6.12

    • Versione Glibc: 2.34

    • Versione OpenSSL: 3.2.2

    • FSx Versione Lustre Client: 2.15.6

    • Versione runc: 1.3.3

    • Versione containerd: containerd github. com/containerd/containerd 1,7,27

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 12.8

    • Versione del driver ENA: 2.15.0g

    • Versione Python: 3.9.24

    • Versione Kubernetes: v1.33.5-eks-113cf36

    • versione iptables-services: 1.8.8

    • versione nginx: 1.28.0

    • versione nvme-cli: 2.13 1.13

    • versione antistress: 1.0.7

    • versione raccolta: 5.12.0.

    • versione acl: 2.3.1

    • versione lustre-client: 2.15.6

    • versione nvidia-imex: 580.95.05

    • versione systemd: 252

    • versione openssh: 8.7

    • versione sudo: 1.9.15

    • versione gcc: 11.5.0

    • versione cmake: 3.22.2

    • versione git: 2.50.1

    • crea versione: 4.3

    • versione cloudwatch-agent: 1.300060.1

    • versione nfs-utils: 2.5.4

    • versione lvm2:2.03.16

    • versione ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versione: 2.0

    • versione rdma-core: 58.

SageMaker HyperPod Versioni AMI per Amazon EKS: 7 novembre 2025

Aggiornamenti generali AMI

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Questo rilascio include gli aggiornamenti seguenti:

Kubernetes v1.28
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.28.15

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.28.15

  • Gli aggiornamenti del pacchetto includono i componenti boto3, botocore, pip, regex, psutil e nvidia container toolkit.

  • Pacchetto aggiunto: annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.29.15

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.29.15

  • Gli aggiornamenti dei pacchetti includono aggiornamenti del kernel, aggiornamenti di glibc e varie librerie di sistema.

  • Pacchetto aggiunto: annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.30.11

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.30.11

  • Gli aggiornamenti dei pacchetti includono aggiornamenti del kernel livepatch e aggiornamenti delle librerie di sistema.

  • Pacchetto aggiunto: annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.31.7

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.31.13

  • AL2023 (arm):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.31.13

    • Versione del kernel: 6.12.46-66.121.amzn2023.aarch64

  • Gli aggiornamenti dei pacchetti includono aggiornamenti estesi delle librerie di sistema, aggiornamenti del kernel e aggiornamenti delle librerie boost.

  • Pacchetti aggiunti: apr-util-lmdb kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.32.3

    • AWSVersione IAM Authenticator: v0.6.29

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.32.9

  • AL2023 (arm):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.32.9

    • Versione del kernel: 6.12.46-66.121.amzn2023.aarch64

  • Gli aggiornamenti dei pacchetti includono aggiornamenti del kernel livepatch e aggiornamenti delle librerie di sistema.

  • Pacchetto aggiunto: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.33.5

    • Versione del kernel: 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (arm):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.33.5

    • Versione del kernel: 6.12.46-66.121.amzn2023.aarch64

  • Gli aggiornamenti dei pacchetti includono aggiornamenti estesi delle librerie di sistema, aggiornamenti del kernel e aggiornamenti delle librerie boost.

  • Pacchetti aggiunti: apr-util-lmdb, aggiornamenti kernel-livepatch

SageMaker HyperPod Versioni AMI per Amazon EKS: 29 ottobre 2025

Aggiornamenti generali AMI

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Questo rilascio include gli aggiornamenti seguenti:

Kubernetes v1.28
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.28.15

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.28.15

  • Gli aggiornamenti del pacchetto includono i componenti boto3, botocore, pip, regex, psutil e nvidia container toolkit.

  • Pacchetto aggiunto: annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.29.15

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.29.15

  • Gli aggiornamenti dei pacchetti includono aggiornamenti del kernel, aggiornamenti di glibc e varie librerie di sistema.

  • Pacchetto aggiunto: annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.30.11

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.30.11

  • Gli aggiornamenti dei pacchetti includono aggiornamenti del kernel livepatch e aggiornamenti delle librerie di sistema.

  • Pacchetto aggiunto: annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.31.7

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.31.13

  • AL2023 (arm):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.31.13

    • Versione del kernel: 6.12.46-66.121.amzn2023.aarch64

  • Gli aggiornamenti dei pacchetti includono aggiornamenti estesi delle librerie di sistema, aggiornamenti del kernel e aggiornamenti delle librerie boost.

  • Pacchetti aggiunti: apr-util-lmdb kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • AL2 (x86_64):

    • Versione del driver NVIDIA: 570.195.03

    • Versione CUDA: 12.8

    • Versione Kubernetes: 1.32.3

  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.32.9

  • AL2023 (arm):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.32.9

    • Versione del kernel: 6.12.46-66.121.amzn2023.aarch64

  • Gli aggiornamenti dei pacchetti includono aggiornamenti del kernel livepatch e aggiornamenti delle librerie di sistema.

  • Pacchetto aggiunto: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.33.5

    • Versione del kernel: 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (arm):

    • Versione del driver NVIDIA: 580.95.05

    • Versione CUDA: 13.0

    • Versione Kubernetes: 1.33.5

    • Versione del kernel: 6.12.46-66.121.amzn2023.aarch64

  • Gli aggiornamenti dei pacchetti includono aggiornamenti estesi delle librerie di sistema, aggiornamenti del kernel e aggiornamenti delle librerie boost.

  • Pacchetti aggiunti: apr-util-lmdb, aggiornamenti kernel-livepatch

SageMaker HyperPod Versioni AMI per Amazon EKS: 22 ottobre 2025

AL2x86

Nota

Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

La nota di rilascio di DLAMI di base è disponibile qui.

  • Versioni EKS 1.28 - 1.32

  • Questa versione contiene le patch CVE per i pacchetti di driver NVIDIA interessati, disponibili nel Nvidia October Security Bulletin.

  • NVIDIA SMI

    NVIDIA-SMI 570.195.03 Driver Version: 570.195.03 CUDA Version: 12.8
  • Versioni principali

    nome del pacchetto version
    versione_quadro 70
    gdr_copy 2.4.1
    supported_ec2_instances G4dn, G5, G6, G6, G6e, P4d, P4de, P5, P5e, P5en
    versione efa 1.43.3
    ebs_volume_type gp3
    nvidia_driver 570,195,03
    posizione_python /3.10 usr/bin/python
    nvidia_cuda_stack /-12,4 usr/local/cuda-12.1,/usr/local/cuda-12.2,/usr/local/cuda-12.3,/usr/local/cuda
    versione_ssm_agent 33,3050,0
    versione_del kernel 5.10.244-240.965.amzn2.x86_64
    versione_container_toolkit_nvidia 1.17.8
    di i_nccl_version 1.16.3
    sistema_operativo Amazon Linux 2
    default_cuda /-12,1/ usr/local/cuda
    architettura_informatica x86_64
  • Pacchetti aggiunti: nessun pacchetto è stato aggiunto in questa versione.

  • Pacchetti aggiornati

    nome del pacchetto versione precedente nuova versione
    boto3 1.40.46 1,40,49
    botocore 1,40,46 1,40,49
    fastapi 0.118.0 0,118,2
    serratura del file 3.19.1 3,20,0
    importlib_metadata 8.7.0 8.0.0
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    matplotlib 3.10.6 3,10,7
    creazione di pacchetti 25 24,2
    piattaforma dirs 4.4.0 4.5.0
    prop cache 0.4.0 04.1
    ricco 14.1.0 14,2,0
    tomli 2.2.1 2.3.0
    types-python-dateutil 2,9,20250822 2,90,20251008
    virtualenv 20,34,0 20,35,1
    client websocket 1.8.0 1.9.0
  • Pacchetti rimossi: nessun pacchetto è stato rimosso in questa versione.

AL2023x86

La nota di rilascio di DLAMI di base è disponibile qui.

  • Versioni EKS 1.28 - 1.32. Nessuna versione per la versione 1.33 di EKS.

  • Questa versione contiene le patch CVE per i pacchetti di driver NVIDIA interessati, disponibili nel Nvidia October Security Bulletin.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • Versioni principali

    nome del pacchetto version
    gdr_copy 2.5.1
    supported_ec2_instances G4dn, G5, G6, G6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200
    versione efa 1.43.3
    ebs_volume_type gp3
    nvidia_gds_version 1.15.0.42
    driver nvidia 580,95,05
    posizione_python /3.9 usr/bin/python
    nvidia_cuda_stack /-13,0 usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda
    versione_ssm_agent 33,3050,0
    versione_del kernel 6.1.153-175.280.amzn2023.x86_64
    versione nvidia_container_toolkit_ 1.17.8
    versione_dcgm 4.4.1
    oi_nccl_version 1.16.3
    sistema_operativo Amazon Linux 2023.9.20250929
    predefinito_cuda /-12,9/ usr/local/cuda
    architettura_informatica x86_64
  • Pacchetti aggiunti: nessun pacchetto è stato aggiunto in questa versione.

  • Pacchetti aggiornati

    nome del pacchetto versione precedente nuova versione
    boto3 1.40.46 1,40,49
    botocore 1,40,46 1,40,49
    fastapi 0.118.0 0,118,2
    copia gdr 2,5-1 2,5,1-1
    gdrcopy-devel 2,5-1 2,5,1-1
    gdrcopy-mod 2,5-1 kms 2,5,1-1 dms
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    altri strumenti e-iter 10.8.0 10.3,0
    creazione di pacchetti 25 24,2
    prop cache 0.4.0 04.1
    pidantico 2.11.10 2.12.0
    pydantic_core 2.33.2 2,41,1
    ricco 14.1.0 14,2,0
    types-python-dateutil 2,90,20250822 2,90,20251008
    estensioni_digitazione 4.12.2 4,15,0
    virtualenv 20,34,0 20,35,1
    client websocket 1.8.0 1.9.0
  • Pacchetti rimossi: nessun pacchetto è stato rimosso in questa versione.

AL2023 ARM64

La nota di rilascio di DLAMI di base è disponibile qui.

  • Versioni EKS 1.31 - 1.33.

  • Questa versione contiene le patch CVE per i pacchetti di driver NVIDIA interessati, disponibili nel Nvidia October Security Bulletin.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • Versioni principali

    nome del pacchetto version
    gdr_copy 2.5
    supported_ec2_instances G5 g, P6e- 00 GB2
    versione efa 1.43.3
    ebs_volume_type gp3
    nvidia_driver 580,95,05
    posizione_python /3.9 usr/bin/python
    nvidia_cuda_stack /-13,0 usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda
    versione_ssm_agent 33,3050,0
    versione_del kernel 6.12.46-66.121.amzn2023.aarch64
    versione_container_toolkit_nvidia 1.17.8
    versione_dcgm 4.4.1
    oi_nccl_version 1.16.3
    sistema_operativo Amazon Linux 2023.9.20250929
    predefinito_cuda /-12,9/ usr/local/cuda
    architettura_informatica aarch64
  • Pacchetti aggiunti: nessun pacchetto è stato aggiunto in questa versione.

  • Pacchetti aggiornati

    nome del pacchetto versione precedente nuova versione
    aiohttp 3.12.15 3,13,0
    attrae 25.3.0 25,40
    boto3 1,40,45 1,40,49
    botocore 1,40,45 1,40,49
    catter 25.2.0 25,3,0
    certificato 20258.3 2025,10,5
    efa 2.17.2-1.amzn2023 2.17.3-1.amzn2023
    API veloce 0.118.0 0,118,2
    lista congelata 1.7.0 1.8.0
    importlib_metadata 8.7.0 8.0.0
    jaraco.context 5.3.0 6.0.1
    multiditto 6.6.4 6,7,0
    narvali 2.6.0 2.7.0
    nh3 0,3,0 0,31
    prop cache 0.3.2 04.1
    pidantico 2.11.9 2.12.0
    pydantic_core 2.33.2 2,41,1
    pilinto 3.3.8 3.3.9
    python-json-logger 3.3.0 4.0.0
    ricco 14.1.0 142,0
    tomli 2.2.1 2.0.1
    types-python-dateutil 2,9,20250822 2,90,20251008
    virtualenv 20,34,0 20,35,1
    client websocket 1.8.0 1.9.0
    filo 1.20.1 1.22.0
    cerniera 3.19.2 3,23,0
  • Pacchetti rimossi: nessun pacchetto è stato rimosso in questa versione.

SageMaker HyperPod Versioni AMI per Amazon EKS: 29 settembre 2025

Aggiornamenti generali AMI

  • Rilasciata la nuova SageMaker HyperPod AMI per Amazon EKS 1.33. Per ulteriori informazioni, consulta le versioni SageMaker HyperPod AMI per Amazon EKS: 29 settembre 2025.

    Importante
    • L'API Kubernetes beta di Dynamic Resource Allocation è abilitata per impostazione predefinita in questa versione.

      • Questa API migliora la pianificazione e il monitoraggio dei carichi di lavoro che richiedono risorse come. GPUs

      • Questa API è stata sviluppata dalla community open source di Kubernetes e potrebbe cambiare nelle future versioni di Kubernetes. Prima di utilizzare l'API, consulta la documentazione di Kubernetes e scopri come influisce sui tuoi carichi di lavoro.

    • HyperPod non sta rilasciando un'AMI HyperPod Amazon Linux 2 per Kubernetes 1.33. AWSconsiglia di migrare alla versione 023. AL2 Per ulteriori informazioni, consulta Eseguire l'aggiornamento da Amazon Linux 2 a AL2 023.

Per ulteriori informazioni, consulta Kubernetes v1.33.

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Questo rilascio include gli aggiornamenti seguenti:

Kubernetes v1.28
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • NVIDIA SMI:

    • Versione del driver NVIDIA: 570.172.08

    • Versione CUDA: 12.8

  • Pacchetti:

    • Linguaggi e librerie di base:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Giava: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Vai a: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • Librerie principali:

      • GLibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • Utilità XZ: 5.2.5-9.amzn2023.0.2

      • UtilLinux: 2.37.4-1.amzn2023.0.4

    • Neurone:

      • aws-neuronx-dkms: 2.23,9,0 - dkm

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • driver efa: 2.17.2-1.amzn2023

      • configurazione efa: 1.18-1.amzn2023

      • programma di aggiornamento efa: 1.2.2-1.amzn2023

      • profilo efa: 1.7-1.amzn2023

    • kernel:

      • kernel: 6.1.148-173.267.amzn2023

      • sviluppo del kernel: 6.1.148-173.267.amzn2023

      • intestazioni del kernel: 6.1.148-173.267.amzn2023

      • strumenti del kernel: 6.1.148-173.267.amzn2023

      • moduli kernel aggiuntivi: 6.1.148-173.267.amzn2023

      • patch live del kernel: 1.0-0.amzn2023

    • Nvidia:

      • toolkit per contenitori nvidia: 1.17.8-1

      • base del toolkit per contenitori nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (con strumenti)

      • gestore di tessuti nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.29
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • NVIDIA SMI:

    • Versione del driver NVIDIA: 570.172.08

    • Versione CUDA: 12.8

  • Pacchetti:

    • Linguaggi e librerie di base:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Giava: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Vai a: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • Librerie principali:

      • GLibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • Utilità XZ: 5.2.5-9.amzn2023.0.2

      • UtilLinux: 2.37.4-1.amzn2023.0.4

    • Neurone:

      • aws-neuronx-dkms: 2.23,9,0 - dkm

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • driver efa: 2.17.2-1.amzn2023

      • configurazione efa: 1.18-1.amzn2023

      • programma di aggiornamento efa: 1.2.2-1.amzn2023

      • profilo efa: 1.7-1.amzn2023

    • kernel:

      • kernel: 6.1.148-173.267.amzn2023

      • sviluppo del kernel: 6.1.148-173.267.amzn2023

      • intestazioni del kernel: 6.1.148-173.267.amzn2023

      • strumenti del kernel: 6.1.148-173.267.amzn2023

      • moduli kernel aggiuntivi: 6.1.148-173.267.amzn2023

      • patch live del kernel: 1.0-0.amzn2023

    • Nvidia:

      • toolkit per contenitori nvidia: 1.17.8-1

      • base del toolkit per contenitori nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (con strumenti)

      • gestore di tessuti nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.30
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • NVIDIA SMI:

    • Versione del driver NVIDIA: 570.172.08

    • Versione CUDA: 12.8

  • Pacchetti:

    • Linguaggi e librerie di base:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Giava: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Vai a: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • Librerie principali:

      • GLibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • Utilità XZ: 5.2.5-9.amzn2023.0.2

      • UtilLinux: 2.37.4-1.amzn2023.0.4

    • Neurone:

      • aws-neuronx-dkms: 2.23,9,0 - dkm

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • driver efa: 2.17.2-1.amzn2023

      • configurazione efa: 1.18-1.amzn2023

      • programma di aggiornamento efa: 1.2.2-1.amzn2023

      • profilo efa: 1.7-1.amzn2023

    • kernel:

      • kernel: 6.1.148-173.267.amzn2023

      • sviluppo del kernel: 6.1.148-173.267.amzn2023

      • intestazioni del kernel: 6.1.148-173.267.amzn2023

      • strumenti del kernel: 6.1.148-173.267.amzn2023

      • moduli kernel aggiuntivi: 6.1.148-173.267.amzn2023

      • patch live del kernel: 1.0-0.amzn2023

    • Nvidia:

      • toolkit per contenitori nvidia: 1.17.8-1

      • base del toolkit per contenitori nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (con strumenti)

      • gestore di tessuti nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.31
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • NVIDIA SMI:

    • Versione del driver NVIDIA: 570.172.08

    • Versione CUDA: 12.8

  • Pacchetti:

    • Linguaggi e librerie di base:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Giava: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Vai a: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • Librerie principali:

      • GLibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • Utilità XZ: 5.2.5-9.amzn2023.0.2

      • UtilLinux: 2.37.4-1.amzn2023.0.4

    • Neurone:

      • aws-neuronx-dkms: 2.23,9,0 - dkm

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • driver efa: 2.17.2-1.amzn2023

      • configurazione efa: 1.18-1.amzn2023

      • programma di aggiornamento efa: 1.2.2-1.amzn2023

      • profilo efa: 1.7-1.amzn2023

    • kernel:

      • kernel: 6.1.148-173.267.amzn2023

      • sviluppo del kernel: 6.1.148-173.267.amzn2023

      • intestazioni del kernel: 6.1.148-173.267.amzn2023

      • strumenti del kernel: 6.1.148-173.267.amzn2023

      • moduli kernel aggiuntivi: 6.1.148-173.267.amzn2023

      • patch live del kernel: 1.0-0.amzn2023

    • Nvidia:

      • toolkit per contenitori nvidia: 1.17.8-1

      • base del toolkit per contenitori nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (con strumenti)

      • gestore di tessuti nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.32
  • Amazon Linux 2 è ora obsoleto. L'AMI Kubernetes è basata su AL2 023.

  • NVIDIA SMI:

    • Versione del driver NVIDIA: 570.172.08

    • Versione CUDA: 12.8

  • Pacchetti:

    • Linguaggi e librerie di base:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Giava: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Vai a: 3.2.0-37.amzn2023

      • Rust: 1.89.0-1.amzn2023.0.2

    • Librerie principali:

      • GLibC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • Utilità XZ: 5.2.5-9.amzn2023.0.2

      • UtilLinux: 2.37.4-1.amzn2023.0.4

    • Neurone:

      • aws-neuronx-dkms: 2.23,9,0 - dkm

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • driver efa: 2.17.2-1.amzn2023

      • configurazione efa: 1.18-1.amzn2023

      • programma di aggiornamento efa: 1.2.2-1.amzn2023

      • profilo efa: 1.7-1.amzn2023

    • kernel:

      • kernel: 6.1.148-173.267.amzn2023

      • sviluppo del kernel: 6.1.148-173.267.amzn2023

      • intestazioni del kernel: 6.1.148-173.267.amzn2023

      • strumenti del kernel: 6.1.148-173.267.amzn2023

      • moduli kernel aggiuntivi: 6.1.148-173.267.amzn2023

      • patch live del kernel: 1.0-0.amzn2023

    • Nvidia:

      • toolkit per contenitori nvidia: 1.17.8-1

      • base del toolkit per contenitori nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (con strumenti)

      • gestore di tessuti nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.33

La tabella seguente contiene informazioni sui componenti di questa versione AMI e delle versioni corrispondenti.

componente AL2023_x86 AL2023_arm64
EKS v1.33.4 v1.33.4
amazon-ssm-agent 3.3.2299,0-1amzn2023 3.3.2299,0-1.amzn2023
aws-neuronx-dkms 2.23,9,0 - kms N/D
containerd 1,7,27-1eks.amzn2023.0,4 1,7,27-1eks.amzn2023,0.4
efa 2.17.2-1.amzn2023 2.17.2-1.amzn2023
ena 2.14,1 g 2,14,1 g
kernel 6.12.40-64.114.amzn2023 N/D
kernel 6.12 N/D 6.12.40-64.114.amzn2023
kmod-nvidia-latest-dkms 570,172,08-1amzn2023 570,172,08-1el9
nvidia-container-toolkit 1,178-1 1,178-1
runc 1.2.6-1.amzn2023.0.1 1.2.6-1.amzn2023.0.1

SageMaker HyperPod Versioni AMI per Amazon EKS: 25 agosto 2025

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Questo rilascio include gli aggiornamenti seguenti:

Kubernetes v1.28

NVIDIA SMI:

  • Driver NVIDIA versione: 570.172.08

  • Versione CUDA: 12.8

Pacchetti aggiunti:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacchetti aggiornati:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Pacchetti rimossi:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repository modificato:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.29

NVIDIA SMI:

  • Driver NVIDIA versione: 570.172.08

  • Versione CUDA: 12.8

Pacchetti aggiunti:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacchetti aggiornati:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Pacchetti rimossi:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repository modificato:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.30

NVIDIA SMI:

  • Driver NVIDIA versione: 570.172.08

  • Versione CUDA: 12.8

Pacchetti aggiunti:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacchetti aggiornati:

  • aws-neuronx-dkms.noarch: 2.22.2,0-dkms → 2.23,9,0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64:1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64:2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64:57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

Pacchetti rimossi:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repository modificato:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.31

NVIDIA SMI:

  • Driver NVIDIA versione: 570.172.08

  • Versione CUDA: 12.8

Pacchetti aggiunti:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacchetti aggiornati:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Pacchetti rimossi:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repository modificato:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.32

NVIDIA SMI:

  • Driver NVIDIA versione: 570.172.08

  • Versione CUDA: 12.8

Pacchetti aggiunti:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacchetti aggiornati:

  • aws-neuronx-dkms.noarch: 2.22.2,0-dkms → 2.23,9,0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64:1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64:2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64:57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

Pacchetti rimossi:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repository modificato:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

SageMaker HyperPod Versioni AMI per Amazon EKS: 12 agosto 2025

L'AMI include quanto segue:

  • AWSServizio supportato: Amazon EC2

  • Sistema operativo: Amazon Linux 2023

  • Architettura di calcolo: ARM64

  • L'ultima versione disponibile è installata per i seguenti pacchetti:

    • Kernel Linux: 6.12

    • FSx Lustro

    • Docker

    • AWS CLIv2 in /usr/bin/aws

    • NVIDIA DCGM

    • Toolkit per container Nvidia:

      • Comando di versione: nvidia-container-cli -V

    • Nvidia-docker2:

      • Comando di versione: nvidia-docker version

    • Nvidia-IMEX: v570.172.08-1

  • Driver NVIDIA: 570.158.01

  • Pila NVIDIA CUDA 12.4, 12.5, 12.6, 12.8:

    • Directory di installazione CUDA, NCCL e cuDDN: /usr/local/cuda-xx.x/

      • Esempio: /usr/local/cuda-12.8/, /usr/local/cuda-12.8/

    • Versione NCCL compilata:

      • Per la directory CUDA 12.4, versione NCCL compilata 2.22.3+ .4 CUDA12

      • Per la directory CUDA 12.5, è stata compilata la versione NCCL 2.22.3+ .5 CUDA12

      • Per la directory CUDA 12.6, è stata compilata la versione NCCL 2.24.3+ .6 CUDA12

      • Per la directory CUDA 12.8, è stata compilata la versione NCCL 2.27.5+ .8 CUDA12

    • CUDA predefinito: 12.8

      • PATH /usr/local/cuda punta a CUDA 12.8

      • Aggiornato di seguito le variabili di ambiente:

        • LD_LIBRARY_PATHavere /usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64

        • PATHavere /usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/

        • Per qualsiasi versione CUDA diversa, aggiorna di LD_LIBRARY_PATH conseguenza.

  • Programma di installazione EFA: 1.42.0

  • GDRCopyNvidia: 2.5.1

  • AWSIl plugin OFI NCCL viene fornito con il programma di installazione EFA

    • Percorsi /opt/amazon/ofi-nccl/lib e vengono aggiunti a. /opt/amazon/ofi-nccl/efa LD_LIBRARY_PATH

  • AWS CLIv2 in /usr/local/bin/aws

  • Tipo di volume EBS: gp3

  • Python: /usr/bin/python3.9

SageMaker HyperPod Versioni AMI per Amazon EKS: 6 agosto 2025

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono i seguenti aggiornamenti:

K8s v1.28
  • Pacchetti Neuron:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23,9,0 - kms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2,25.145,0-1

K8s v1.29
  • Pacchetti Neuron:

    • aws-neuronx-collectives: 2,27,34,0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23,9,0 - kms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2,25.145,0-1

K8s v1.30
  • Pacchetti Neuron:

    • aws-neuronx-collectives: 2,27,34,0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23,9,0 - kms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2,25.145,0-1

K8s v1.31
  • Pacchetti Neuron:

    • aws-neuronx-collectives: 2,27,34,0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23,9,0 - kms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2,25.145,0-1

K8s v1.32
  • Pacchetti Neuron:

    • aws-neuronx-collectives: 2,27,34,0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23,9,0 - kms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plugin: 2.27.7.0-1

    • aws-neuronx-k8-scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2,25.145,0-1

Importante
  • Deep Learning Base OSS Nvidia Driver AMI (Amazon Linux 2) versione 70.3

  • Deep Learning Base Proprietary Nvidia Driver AMI (Amazon Linux 2) versione 68.4

  • Supporto CUDA 12.8 più recente

  • Driver Nvidia aggiornato da 570.158.01 a 570.172.08 per correggere le CVE presenti nel bollettino Nvidia Security Bulletin di luglio.

SageMaker HyperPod Versioni AMI per Amazon EKS: 31 luglio 2025

Amazon SageMaker HyperPod ora supporta una nuova AMI per i cluster Amazon EKS che aggiorna il sistema operativo di base ad Amazon Linux 2023. Questa versione offre diversi miglioramenti rispetto ad Amazon Linux 2 (AL2). HyperPod nuove versioni vengono rilasciate AMIs regolarmente e ti consigliamo di eseguire tutti i HyperPod cluster sulle versioni più recenti e sicure di AMIs per risolvere le vulnerabilità ed eliminare gradualmente software e librerie obsoleti.

Aggiornamenti chiave

  • Sistema operativo: Amazon Linux 2023 (aggiornato da Amazon Linux 2 o AL2)

  • Package Manager: DNF è lo strumento di gestione dei pacchetti predefinito, che sostituisce YUM utilizzato in AL2

  • Servizio di rete: systemd-networkd gestisce le interfacce di rete, sostituendo ISC utilizzato in dhclient AL2

  • Kernel Linux: versione 6.1, aggiornata dal kernel utilizzato in AL2

  • Glibc: versione 2.34, aggiornata dalla versione in AL2

  • GCC: Versione 11.5.0, aggiornata dalla versione in AL2

  • NFS: versione 1:2.6 .1, aggiornata dalla versione 1:1.3 .4 in AL2

  • Driver NVIDIA: versione 570.172.08, una versione del driver più recente

  • Python: versione 3.9, che sostituisce Python 2.7 utilizzato in AL2

  • NVME: versione 1.11.1, una versione più recente del driver NVMe

Prima dell’aggiornamento

Ci sono alcune cose importanti da sapere prima dell’aggiornamento. Con AL2 023, sono stati aggiunti, aggiornati o rimossi diversi pacchetti rispetto a. AL2 Consigliamo vivamente di testare le applicazioni con AL2 023 prima di aggiornare i cluster. Per un elenco completo di tutte le modifiche ai pacchetti nella versione AL2 023, consulta Modifiche ai pacchetti in Amazon Linux 2023.

Di seguito sono riportate alcune delle modifiche significative tra AL2 e AL2 023:

  • Python 3.10: l’aggiornamento più importante, a parte il sistema operativo, è l’aggiornamento della versione di Python. Dopo l’aggiornamento, l’impostazione predefinita per i cluster sarà Python 3.10. Anche se alcuni carichi di lavoro di addestramento distribuito Python 3.8 possono essere compatibili con Python 3.10, consigliamo vivamente di testare separatamente gli specifici carichi di lavoro. Se la migrazione a Python 3.10 presenta difficoltà, ma desideri comunque aggiornare il cluster per accedere ad altre nuove funzionalità, puoi installare una versione precedente di Python utilizzando il comando yum install python-xx.x con gli script del ciclo di vita prima di eseguire qualsiasi carico di lavoro. Assicurati di testare sia gli script del ciclo di vita esistenti che il codice dell’applicazione per verificarne la compatibilità.

  • NVIDIA Runtime Enforcement: AL2 023 applica rigorosamente i requisiti di runtime dei container NVIDIA, facendo sì che i contenitori con variabili di ambiente NVIDIA codificate (ad esempioNVIDIA_VISIBLE_DEVICES: "all") non funzionino sui nodi che utilizzano solo la CPU (mentre ignora queste impostazioni quando non sono presenti driver GPU). AL2 Puoi ignorare l’imposizione configurando NVIDIA_VISIBLE_DEVICES: "void" nelle specifiche del pod o ricorrendo a immagini che utilizzano solo la CPU.

  • cgroup v2: AL2 023 presenta la nuova generazione di gerarchia unificata dei gruppi di controllo (cgroup v2). cgroup v2 viene utilizzato per i runtime dei container ed è utilizzato anche dasystemd. Sebbene AL2 023 includa ancora codice che può far funzionare il sistema utilizzando cgroup v1, questa non è una configurazione consigliata.

  • Amazon VPC CNI e eksctl versioni: AL2 023 richiede inoltre che la versione Amazon VPC CNI sia 1.16.2 o successiva e la versione 0.176.0 o superiore. eksctl

  • EFA on FSx for Lustre: ora puoi usare EFA on FSx for Lustre, che ti consente di ottenere prestazioni applicative paragonabili a quelle dei cluster locali AI/ML o HPC (High Performance Computing), beneficiando al contempo della scalabilità, della flessibilità e dell'elasticità del cloud computing.

Inoltre, l'aggiornamento alla versione AL2 023 richiede una versione minima di 1.0.643.0_1.0.192.0 Health Monitoring Agent. Completa la procedura seguente per aggiornare l’agente di monitoraggio dell’integrità:

  1. Se utilizzi script HyperPod del ciclo di vita dal GitHub repository awsome-distributed-training, assicurati di scaricare la versione più recente. Le versioni precedenti non sono compatibili con la versione 023. AL2 Il nuovo script del ciclo di vita garantisce l'containerdutilizzo dello spazio di archiviazione aggiuntivo montato per inserire le immagini dei contenitori in 023. AL2

  2. Inserisci l'ultima versione del repository git HyperPod CLI.

  3. Aggiorna le dipendenze con il comando seguente: helm dependencies update helm_chart/HyperPodHelmChart.

  4. Come indicato nel passaggio 4 del README di HyperPodHelmChart, esegui il comando seguente per aggiornare la versione delle dipendenze in esecuzione sul cluster: helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system

Carichi di lavoro testati su cluster EKS aggiornati

Di seguito sono riportati alcuni casi d’uso nei quali l’aggiornamento è stato testato:

  • Compatibilità con le versioni precedenti: i lavori di formazione distribuiti più diffusi che coinvolgono PyTorch dovrebbero essere retrocompatibili sulla nuova AMI. Tuttavia, poiché i carichi di lavoro possono dipendere da specifiche librerie Python o Linux, ti consigliamo di eseguire test su ambienti più piccoli o su un sottoinsieme di nodi prima di aggiornare i cluster più grandi.

  • Test degli acceleratori: sono stati testati lavori su vari tipi di istanze, utilizzando sia gli acceleratori NVIDIA (per le famiglie di istanze P e G) che gli acceleratori AWS Neuron (per le istanze Trn).

Come aggiornare l’AMI e i carichi di lavoro associati

Puoi eseguire l’aggiornamento alla nuova AMI utilizzando uno dei seguenti metodi:

  • Utilizza l’API create-cluster per creare un nuovo cluster con l’AMI più recente.

  • Usa l'API per aggiornare il tuo cluster esistente. update-cluster-software Tieni presente che questa opzione esegue nuovamente tutti gli script del ciclo di vita.

Il cluster non è disponibile durante il processo di aggiornamento. Consigliamo di pianificare questo tempo di inattività e di riavviare il carico di lavoro di addestramento da un checkpoint esistente una volta completato l’aggiornamento. Come best practice, ti suggeriamo di eseguire test su cluster più piccoli prima di aggiornare i cluster più grandi.

Se il comando update non riesce, devi identificare prima di tutto la causa dell’errore. In caso di errori degli script del ciclo di vita, apporta le correzioni necessarie agli script e riprova. Per altri problemi non risolvibili, contatta il Supporto AWS.

risoluzione dei problemi

Utilizza la sezione seguente per aiutarti a risolvere eventuali problemi riscontrati durante l'aggiornamento a AL2 023.

Come posso correggere errori come "nvml error: driver not loaded: unknown" sui nodi del cluster che utilizzano solo la CPU?

Se i contenitori che funzionavano sui nodi AL2 Amazon EKS della CPU ora falliscono su AL2 023, l'immagine del contenitore potrebbe avere variabili di ambiente NVIDIA codificate. Puoi verificare la presenza di variabili di ambiente con codifica fissa con il comando seguente:

docker inspect image:tag | grep -i nvidia

AL2023 applica rigorosamente questi requisiti, mentre AL2 era più indulgente sui nodi che utilizzano solo CPU. Una soluzione consiste nell'ignorare l'applicazione AL2 023 impostando determinate variabili di ambiente NVIDIA nelle specifiche del pod Amazon EKS, come mostrato nell'esempio seguente:

yaml containers: - name: your-container image: your-image:tag env: - name: NVIDIA_VISIBLE_DEVICES value: "void" - name: NVIDIA_DRIVER_CAPABILITIES value: ""

In alternativa, si possono impiegare le immagini del container che utilizzano solo la CPU (ad esempio pytorch/pytorch:latest-cpu) oppure creare immagini personalizzate senza dipendenze NVIDIA.

SageMaker HyperPod Versioni AMI per Amazon EKS: 15 luglio 2025

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono i seguenti aggiornamenti:

K8s v1.28
  • Driver NVIDIA più recente: 550.163.01

  • CUDA predefinito: 12.4

  • Programma di installazione EFA: 1.38.0

  • Pacchetti Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2,0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2,18.3,0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1,6,21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0,2,3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16,1,0_0a6506a47-1

    • aws-neuronx-k8 plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2,26.26,0-1

    • aws-neuronx-runtime-lib.x86_64:2,26.42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2,24.54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2,10,12.12.2.0-0

K8s v1.29
  • Driver NVIDIA versione: 550.163.01

  • Versione CUDA: 12.4

  • Programma di installazione EFA: 1.38.0

  • Pacchetti Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-kms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2,18.3,0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1,6,21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0,2,3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16,1,0_0a6506a47-1

    • aws-neuronx-k8 plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2,26.26,0-1

    • aws-neuronx-runtime-lib.x86_64:2,26.42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2,24.54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2,10,12.12.2.0-0

K8s v1.30
  • Driver NVIDIA versione: 550.163.01

  • Versione CUDA: 12.4

  • Versione del programma di installazione EFA: 1.38.0

  • Pacchetti Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-kms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2,18.3,0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1,6,21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0,2,3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16,1,0_0a6506a47-1

    • aws-neuronx-k8 plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2,26.26,0-1

    • aws-neuronx-runtime-lib.x86_64:2,26.42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2,24.54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2,10,12.12.2.0-0

K8s v1.31
  • Driver NVIDIA versione: 550.163.01

  • Versione CUDA: 12.4

  • Versione del programma di installazione EFA: 1.38.0

  • Pacchetti Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-kms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2,18.3,0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1,6,21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0,2,3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16,1,0_0a6506a47-1

    • aws-neuronx-k8 plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2,26.26,0-1

    • aws-neuronx-runtime-lib.x86_64:2,26.42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2,24.54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2,10,12.12.2.0-0

K8s v1.32
  • Driver NVIDIA versione: 550.163.01

  • Versione CUDA: 12.4

  • Versione del programma di installazione EFA: 1.38.0

  • Pacchetti Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-kms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2,18.3,0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1,6,21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0,2,3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64: 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16,1,0_0a6506a47-1

    • aws-neuronx-k8 plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2,26.26,0-1

    • aws-neuronx-runtime-lib.x86_64:2,26.42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2,24.54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2,10,12.12.2.0-0

SageMaker HyperPod Versioni AMI per Amazon EKS: 9 giugno 2025

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.21.37.0 (dalla versione 2.20.74.0)

SageMaker HyperPod Versioni AMI per Amazon EKS: 22 maggio 2025

Aggiornamenti generali AMI

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Deep Learning Base AMI AL2
  • Driver NVIDIA più recente: 550.163.01

  • Aggiornamenti dello stack CUDA:

    • CUDA predefinito: 12.1

    • Versione NCCL: 2.22.3

  • Programma di installazione EFA: 1.38.0

  • AWSOFI NCCL: 1.13.2

  • Kernel Linux: 5.10

  • GDRCopy: 2,4

Importante
  • Aggiornamento del Kit di strumenti per container NVIDIA 1.17.4: il montaggio delle librerie compatibili CUDA è ora disabilitato

  • Aggiornamenti EFA dalla versione 1.37 alla 1.38:

    • AWSIl plugin OFI NCCL ora si trova in/-nccl opt/amazon/ofi

    • La posizione precedente /opt//è obsoleta aws-ofi-nccl

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (dal 2.20.28.0)

  • aws-neuronx-collectives.x86_64:2.25.65.0_9858ac9a1-1 (da 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64:2.25.57.0_166c7a468-1 (da 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64: 2.23.9.0 (da 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (dalla 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64:0.15.1.0_5d31b6a3f (da 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (dal 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (dal 2.24.23.0)

Note di supporto:

  • I componenti AMI, incluse le versioni CUDA, possono essere rimossi o modificati in base alla policy di supporto del framework

  • La versione del kernel è bloccata tramite pinning per la compatibilità. Gli utenti devono evitare gli aggiornamenti a meno che non siano necessari per le patch di sicurezza

  • Per le EC2 istanze con più schede di rete, consulta la guida alla configurazione EFA per una corretta configurazione

SageMaker HyperPod Versioni AMI per Amazon EKS: 7 maggio 2025

Installed the latest version ofAWSNeuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neurone

SageMaker HyperPod Versioni AMI per Amazon EKS: 28 aprile 2025

Miglioramenti per K8s

  • Driver NVIDIA aggiornato dalla versione 550.144.03 alla 550.163.01. Questo aggiornamento è destinato a risolvere le vulnerabilità e le esposizioni comuni (CVEs) presenti nel NVIDIA GPU Display Security Bulletin di aprile 2025.

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Installed the latest version ofAWSNeuron SDK
  • aws-neuronx-dkms.noarch: 2,20.28,0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4,0-1

  • aws-neuronx-tools.x86_64: 2,18.3,0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1,6,21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64:2,24.59,0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64:0,2,3,0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0,14-12,0-1

  • aws-neuronx-gpsimd-tools.x86_64:0,14.6,0_241eb69f4-1

  • aws-neuronx-k8 plugin.x86_64:2.24.23.0-1

  • aws-neuronx-k8-scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64:2,24.53,0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2.22.61.0-1

  • tensorflow-model-server-neuronx.x86_64: 2,10,1,2,2,0-0

SageMaker HyperPod Versioni AMI per Amazon EKS: 18 aprile 2025

Aggiornamenti generali AMI

  • Nuova SageMaker HyperPod AMI per Amazon EKS 1.32.1.

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

Deep Learning EKS AMI 1.32.1
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.32.1

    • Versione Containerd: 1.7.27

    • Versione Runc: 1.1.14

    • AWSAutenticatore IAM: 0.6.29

  • Agente Amazon SSM: 3.3.1611.0

  • Kernel Linux: 5.10.235

  • Driver OSS Nvidia: 550.163.01

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.38.0

  • GDRCopy: 2.4.1-1

  • Kit di strumenti per container Nvidia: 1.17.6

  • AWSOFI NCCL: 1.13.2

  • aws-neuronx-tools: 2.18.3,0

  • aws-neuronx-runtime-lib: 2,24,53,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,20,28,0

  • aws-neuronx-collectives: 2,2459,0

SageMaker HyperPod Versioni AMI per Amazon EKS: 18 febbraio 2025

Miglioramenti per K8s

  • Kit di strumenti per container Nvidia aggiornato dalla versione 1.17.3 alla versione 1.17.4.

  • È stato risolto il problema che impediva ai clienti di connettersi ai nodi dopo il riavvio.

  • Versione Elastic Fabric Adapter (EFA) aggiornata dalla 1.37.0 alla 1.38.0.

  • L'EFA ora include il plug-in AWS OFI NCCL, che si trova nella /opt/amazon/ofi-nccl directory anziché nel percorso originale. /opt/aws-ofi-nccl/ Se devi aggiornare la variabile di ambiente LD_LIBRARY_PATH, assicurati di modificare il percorso in modo che punti alla nuova posizione /opt/amazon/ofi-nccl del plugin OFI NCCL.

  • Da questi file è stato rimosso il pacchetto emacs. DLAMIs Puoi installare emacs da GNU emac.

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64,0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4,0-1 @neuron

  • aws-neuronx-tools.x86_64: 2,18,0-1 @neuron

  • aws-neuronx-collectives.x86_64:2.23.135.0_3e70920f2-1 neurone

  • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1 neurone

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64:0.13.2.0_94ba34927-1 neurone

  • aws-neuronx-k8-plugin.x86_64:2.23.45.0-1 neurone

  • aws-neuronx-k8-scheduler.x86_64: 2.23.45.0-1 neurone

  • aws-neuronx-runtime-lib.x86_64:2.23.112.0_9b5179492-1 neurone

  • aws-neuronx-tools.x86_64: 2.20.204.0-1 neurone

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod Versioni AMI per Amazon EKS: 22 gennaio 2025

Aggiornamenti generali AMI

  • Nuova SageMaker HyperPod AMI per Amazon EKS 1.31.2.

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

Deep Learning EKS AMI 1.31
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.31.2

    • Versione Containerd: 1.7.23

    • Versione Runc: 1.1.14

    • AWSAutenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.230

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.37.0

  • GDRCopy: 2.4.1-1

  • Kit di strumenti per container Nvidia: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2,23.133,0

SageMaker HyperPod Versioni AMI per Amazon EKS: 21 dicembre 2024

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

K8s v1.28
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.28.15

    • Versione Containerd: 1.7.23

    • Versione Runc: 1.1.14

    • AWSAutenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.37.0

  • GDRCopy: 2.4

  • Kit di strumenti per container NVIDIA: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.29
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.29.10

    • Versione Containerd: 1.7.23

    • Versione Runc: 1.1.14

    • AWSAutenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.15.0

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.37.0

  • GDRCopy: 2.4

  • Kit di strumenti per container Nvidia: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.30
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.30.6

    • Versione Containerd: 1.7.23

    • Versione Runc: 1.1.14

    • AWSAutenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987.0

  • Kernel Linux: 5.10.228

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.37.0

  • GDRCopy: 2.4

  • Kit di strumenti per container Nvidia: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2,23,135,0

SageMaker HyperPod Versioni AMI per Amazon EKS: 13 dicembre 2024

SageMaker HyperPod Aggiornamento DLAMI per Amazon EKS

  • Agente SSM aggiornato alla versione 3.3.1311.0.

SageMaker HyperPod Versioni AMI per Amazon EKS: 24 novembre 2024

Aggiornamenti generali AMI

  • Rilasciata nella Regione MEL (Melbourne).

  • DLAMI di SageMaker HyperPod base aggiornato alle seguenti versioni:

    • Kubernetes: 01/11/2024.

SageMaker HyperPod Versioni AMI per Amazon EKS: 15 novembre 2024

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

Deep Learning EKS AMI 1.28
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.28.15

    • Versione Containerd: 1.7.23

    • Versione Runc: 1.1.14

    • AWSAutenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.34.0

  • GDRCopy: 2.4

  • Kit di strumenti per container NVIDIA: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,2,19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.29
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.29.10

    • Versione Containerd: 1.7.23

    • Versione Runc: 1.1.14

    • AWSAutenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.34.0

  • GDRCopy: 2.4

  • Kit di strumenti per container Nvidia: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,2,19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.30
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.30.6

    • Versione Containerd: 1.7.23

    • Versione Runc: 1.1.14

    • AWSAutenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.34.0

  • GDRCopy: 2.4

  • Kit di strumenti per container Nvidia: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,2,19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2.22.33.0

SageMaker HyperPod Versioni AMI per Amazon EKS: 11 novembre 2024

Aggiornamenti generali AMI

  • SageMaker HyperPod DLAMI aggiornato con le versioni di Amazon EKS 1.28.13, 1.29.8, 1.30.4.

SageMaker HyperPod Versioni AMI per Amazon EKS: 21 ottobre 2024

Aggiornamenti generali AMI

  • DLAMI di SageMaker HyperPod base aggiornato alle seguenti versioni:

    • Amazon EKS: 1.28.11, 1.29.6, 1.30.2.

SageMaker HyperPod Versioni AMI per Amazon EKS: 10 settembre 2024

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

Deep Learning EKS AMI 1.28
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.28.11

    • Versione Containerd: 1.7.20

    • Versione Runc: 1.1.11

    • AWSAutenticatore IAM: 0.6.21

  • Agente Amazon SSM: 3.3.380

  • Kernel Linux: 5.10.223

  • Driver OSS NVIDIA: 535.183.01

  • NVIDIA CUDA: 12.2

  • Programma di installazione EFA: 1.32.0

  • GDRCopy: 2.4

  • Kit di strumenti per container NVIDIA: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 217.17,0

  • aws-neuronx-collectives: 2,21,46,0

Deep Learning EKS AMI 1.29
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.29.6

    • Versione Containerd: 1.7.20

    • Versione Runc: 1.1.11

    • AWSAutenticatore IAM: 0.6.21

  • Agente Amazon SSM: 3.3.380

  • Kernel Linux: 5.10.223

  • Driver OSS Nvidia: 535.183.01

  • NVIDIA CUDA: 12.2

  • Programma di installazione EFA: 1.32.0

  • GDRCopy: 2.4

  • Kit di strumenti per container Nvidia: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 217.17,0

  • aws-neuronx-collectives: 2,214,0

Deep Learning EKS AMI 1.30
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.30.2

    • Versione Containerd: 1.7.20

    • Versione Runc: 1.1.11

    • AWSAutenticatore IAM: 0.6.21

  • Agente Amazon SSM: 3.3.380

  • Kernel Linux: 5.10.223

  • Driver OSS Nvidia: 535.183.01

  • NVIDIA CUDA: 12.2

  • Programma di installazione EFA: 1.32.0

  • GDRCopy: 2.4

  • Kit di strumenti per container Nvidia: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 217.17,0

  • aws-neuronx-collectives: 2,214,0