SageMaker HyperPod Publications d'AMI pour Amazon EKS - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

SageMaker HyperPod Publications d'AMI pour Amazon EKS

Les notes de mise à jour suivantes présentent les dernières mises à jour des versions Amazon SageMaker HyperPod AMI pour l'orchestration Amazon EKS. Chaque note de mise à jour inclut une liste résumée des packages préinstallés ou préconfigurés pour le support SageMaker HyperPod DLAMIs Amazon EKS. Chaque DLAMI est construit AL2 sur 023 et prend en charge une version spécifique de Kubernetes. Pour les versions HyperPod de DLAMI pour l'orchestration de Slurm, voir. SageMaker HyperPod Publications d'AMI pour Slurm Pour plus d'informations sur les versions des SageMaker HyperPod fonctionnalités d'Amazon, consultezNotes de SageMaker HyperPod publication d'Amazon.

SageMaker Publications de l'AMI Hyperpod pour Amazon EKS : 22 novembre 2025

Mises à jour générales de l’AMI

SageMaker Assistance relative au DLAMI Hyperpod pour Amazon EKS

Cette version inclut les mises à jour suivantes :

Kubernetes v1.28
  • AL2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du noyau Linux : 5.10

    • Version de Glibc : 2.26

    • Version d'OpenSSL : 1.0.2k-fips

    • FSx Version du client Lustre : 2.12.8

    • Version Docker : version 25.0.13 de Docker, version 0bab007

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • Version v2 de l'AWS CLI : aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.2

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.7.16

    • Version de Kubernetes : v1.28.15-eks-473151a

    • Version des services iptables : 1.8.4

    • Version nginx : 1.20.1

    • Version nvme-cli : 1.11.1

    • version d'epel-release : 7

    • version anti-stress : 1.0.4

    • Version collectée : 5.8.1

    • Version ACL : 2.2.51

    • Version de rsyslog : 8.24.0

    • Version du client lustre : 2.12.8

    • version du système : 219

    • version d'openssh : 7.4

    • version sudo : 1.8.23

    • Version gcc : 7.3.1

    • Version de cmake : 2.8.12.2

    • Version git : 2.47.3

    • Version de marque : 3.82

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 1.3.0

    • Version lvm2 : 2.02,187

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

  • AL2023 (x86_64) :

    • Version du noyau Linux : 6.1

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.28.15-eks-473151a

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

Kubernetes v1.29
  • AL2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du noyau Linux : 5.10

    • Version de Glibc : 2.26

    • Version d'OpenSSL : 1.0.2k-fips

    • FSx Version du client Lustre : 2.12.8

    • Version Docker : version 25.0.13 de Docker, version 0bab007

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • Version v2 de l'AWS CLI : aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.2

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.7.16

    • Version de Kubernetes : v1.29.15-eks-473151a

    • Version des services iptables : 1.8.4

    • Version nginx : 1.20.1

    • Version nvme-cli : 1.11.1

    • version d'epel-release : 7

    • version anti-stress : 1.0.4

    • Version collectée : 5.8.1

    • Version ACL : 2.2.51

    • Version de rsyslog : 8.24.0

    • Version du client lustre : 2.12.8

    • version du système : 219

    • version d'openssh : 7.4

    • version sudo : 1.8.23

    • Version gcc : 7.3.1

    • Version de cmake : 2.8.12.2

    • Version git : 2.47.3

    • Version de marque : 3.82

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 1.3.0

    • Version lvm2 : 2.02,187

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

  • AL2023 (x86_64) :

    • Version du noyau Linux : 6.1

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.29.15-eks-473151a

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

Kubernetes v1.30
  • AL2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du noyau Linux : 5.10

    • Version de Glibc : 2.26

    • Version d'OpenSSL : 1.0.2k-fips

    • FSx Version du client Lustre : 2.12.8

    • Version Docker : version 25.0.13 de Docker, version 0bab007

    • Version d'exécution : 1.3.2

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • Version v2 de l'AWS CLI : aws-cli/1.42.69 Python/3.10.17 Linux/5.10.245-241.976.amzn2.x86_64 botocore/1.40.69

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.2

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.7.16

    • Version de Kubernetes : v1.30.11-eks-473151a

    • Version des services iptables : 1.8.4

    • Version nginx : 1.20.1

    • Version nvme-cli : 1.11.1

    • version d'epel-release : 7

    • version anti-stress : 1.0.4

    • Version collectée : 5.8.1

    • Version ACL : 2.2.51

    • Version de rsyslog : 8.24.0

    • Version du client lustre : 2.12.8

    • version du système : 219

    • version d'openssh : 7.4

    • version sudo : 1.8.23

    • Version gcc : 7.3.1

    • Version de cmake : 2.8.12.2

    • Version git : 2.47.3

    • Version de marque : 3.82

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 1.3.0

    • Version lvm2 : 2.02,187

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 58.

  • AL2023 (x86_64) :

    • Version du noyau Linux : 6.1

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.30.11-eks-473151a

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

Kubernetes v1.31
  • AL2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du noyau Linux : 5.10

    • Version de Glibc : 2.26

    • Version d'OpenSSL : 1.0.2k-fips

    • FSx Version du client Lustre : 2.12.8

    • Version Docker : version 25.0.13 de Docker, version 0bab007

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • Version v2 de l'AWS CLI : aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.2

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.7.16

    • Version de Kubernetes : v1.31.7-eks-473151a

    • Version des services iptables : 1.8.4

    • Version nginx : 1.20.1

    • Version nvme-cli : 1.11.1

    • version d'epel-release : 7

    • version anti-stress : 1.0.4

    • Version collectée : 5.8.1

    • Version ACL : 2.2.51

    • Version de rsyslog : 8.24.0

    • Version du client lustre : 2.12.8

    • version du système : 219

    • version d'openssh : 7.4

    • version sudo : 1.8.23

    • Version gcc : 7.3.1

    • Version de cmake : 2.8.12.2

    • Version git : 2.47.3

    • Version de marque : 3.82

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 1.3.0

    • Version lvm2 : 2.02,187

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

  • AL2023 (x86_64) :

    • Version du noyau Linux : 6.1

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.31.13-eks-113cf36

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

  • AL2203 (ARM64) :

    • Version du noyau Linux : 6.12

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.31.13-eks-113cf36

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • Version Nvidia-IMEX : 580.95.05

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 58.

Kubernetes v1.32
  • AL2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du noyau Linux : 5.10

    • Version de Glibc : 2.26

    • Version d'OpenSSL : 1.0.2k-fips

    • FSx Version du client Lustre : 2.12.8

    • Version Docker : version 25.0.13 de Docker, version 0bab007

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • Version v2 de l'AWS CLI : aws-cli/1.42.74 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.74

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.2

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.7.16

    • Version de Kubernetes : v1.32.3-eks-473151a

    • Version des services iptables : 1.8.4

    • Version nginx : 1.20.1

    • Version nvme-cli : 1.11.1

    • version d'epel-release : 7

    • version anti-stress : 1.0.4

    • Version collectée : 5.8.1

    • Version ACL : 2.2.51

    • Version de rsyslog : 8.24.0

    • Version du client lustre : 2.12.8

    • version du système : 219

    • version d'openssh : 7.4

    • version sudo : 1.8.23

    • Version gcc : 7.3.1

    • Version de cmake : 2.8.12.2

    • Version git : 2.47.3

    • Version de marque : 3.82

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 1.3.0

    • Version lvm2 : 2.02,187

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

  • AL2023 (x86_64) :

    • Version du noyau Linux : 6.1

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.32.9-eks-113cf36

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

  • AL2203 (ARM64) :

    • Version du noyau Linux : 6.12

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.32.9-eks-113cf36

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • Version Nvidia-IMEX : 580.95.05

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 58.

Kubernetes v1.33
  • AL2023 (x86_64) :

    • Version du noyau Linux : 6.1

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • dans la version Neuronx DMS : 2.24.7.0

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.33.5-eks-113cf36

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 59.

  • AL2203 (ARM64) :

    • Version du noyau Linux : 6.12

    • Version de Glibc : 2.34

    • Version d'OpenSSL : 3.2.2

    • FSx Version du client Lustre : 2.15.6

    • Version d'exécution : 1.3.3

    • Version conteneurisée : containerd github. com/containerd/containerd 1,7,27

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 12.8

    • Version du pilote ENA : 2.15.0g

    • Version de Python : 3.9.24

    • Version de Kubernetes : v1.33.5-eks-113cf36

    • Version des services iptables : 1.8.8

    • Version nginx : 1.28.0

    • Version de nvme-cli : 2,13 1,13

    • version anti-stress : 1.0.7

    • Version collectée : 5.12.0.

    • Version ACL : 2.3.1

    • Version du client lustre : 2.15.6

    • Version Nvidia-IMEX : 580.95.05

    • version du système : 252

    • version d'openssh : 8.7

    • version sudo : 1.9.15

    • Version gcc : 11.5.0

    • Version de cmake : 3.2.2

    • Version git : 2.50.1

    • Version de marque : 4.3

    • Version de l'agent CloudWatch : 1.300060.1

    • Version de nfs-utils : 2.5.4

    • Version en lvm2 : 2.03,16

    • Version ec2-instance-connect : 1.1

    • aws-cfn-bootstrap version : 2.0

    • Version RDMA-Core : 58.

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 7 novembre 2025

Mises à jour générales de l’AMI

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Cette version inclut les mises à jour suivantes :

Kubernetes v1.28
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.28.15

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.28.15

  • Les mises à jour du package incluent les composants boto3, botocore, pip, regex, psutil et nvidia container toolkit.

  • Paquet ajouté : annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.29.15

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.29.15

  • Les mises à jour du package incluent les mises à jour du noyau, les mises à jour de la glibc et diverses bibliothèques système.

  • Paquet ajouté : annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.30.11

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.30.11

  • Les mises à jour du package incluent les mises à jour du noyau LivePatch et les mises à jour de la bibliothèque système.

  • Paquet ajouté : annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.31.7

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.31.13

  • AL2023 (bras) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.31.13

    • Version du noyau : 6.12.46-66.121.amzn2023.aarch64

  • Les mises à jour du package incluent des mises à jour complètes de la bibliothèque système, des mises à jour du noyau et des mises à jour de la bibliothèque Boost.

  • Paquets ajoutés : apr-util-lmdb kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.32.3

    • AWSVersion de l'authentificateur IAM : v0.6.29

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.32.9

  • AL2023 (bras) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.32.9

    • Version du noyau : 6.12.46-66.121.amzn2023.aarch64

  • Les mises à jour du package incluent les mises à jour du noyau LivePatch et les mises à jour de la bibliothèque système.

  • Paquet ajouté : annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.33.5

    • Version du noyau : 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (bras) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.33.5

    • Version du noyau : 6.12.46-66.121.amzn2023.aarch64

  • Les mises à jour du package incluent des mises à jour complètes de la bibliothèque système, des mises à jour du noyau et des mises à jour de la bibliothèque Boost.

  • Paquets ajoutés : apr-util-lmdb, kernel-livepatch updates

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 29 octobre 2025

Mises à jour générales de l’AMI

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Cette version inclut les mises à jour suivantes :

Kubernetes v1.28
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.28.15

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.28.15

  • Les mises à jour du package incluent les composants boto3, botocore, pip, regex, psutil et nvidia container toolkit.

  • Paquet ajouté : annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.29.15

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.29.15

  • Les mises à jour du package incluent les mises à jour du noyau, les mises à jour de la glibc et diverses bibliothèques système.

  • Paquet ajouté : annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.30.11

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.30.11

  • Les mises à jour du package incluent les mises à jour du noyau LivePatch et les mises à jour de la bibliothèque système.

  • Paquet ajouté : annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.31.7

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.31.13

  • AL2023 (bras) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.31.13

    • Version du noyau : 6.12.46-66.121.amzn2023.aarch64

  • Les mises à jour du package incluent des mises à jour complètes de la bibliothèque système, des mises à jour du noyau et des mises à jour de la bibliothèque Boost.

  • Paquets ajoutés : apr-util-lmdb kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • AL2 (x86_64) :

    • Version du pilote NVIDIA : 570.195.03

    • Version CUDA : 12.8

    • Version de Kubernetes : 1.32.3

  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.32.9

  • AL2023 (bras) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.32.9

    • Version du noyau : 6.12.46-66.121.amzn2023.aarch64

  • Les mises à jour du package incluent les mises à jour du noyau LivePatch et les mises à jour de la bibliothèque système.

  • Paquet ajouté : annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.33.5

    • Version du noyau : 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (bras) :

    • Version du pilote NVIDIA : 580.95.05

    • Version CUDA : 13,0

    • Version de Kubernetes : 1.33.5

    • Version du noyau : 6.12.46-66.121.amzn2023.aarch64

  • Les mises à jour du package incluent des mises à jour complètes de la bibliothèque système, des mises à jour du noyau et des mises à jour de la bibliothèque Boost.

  • Paquets ajoutés : apr-util-lmdb, kernel-livepatch updates

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 22 octobre 2025

AL2x86

Note

Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

La note de mise à jour du DLAMI de base est disponible ici.

  • Versions EKS 1.28 à 1.32

  • Cette version contient des correctifs CVE pour les packages de pilotes NVIDIA concernés, disponibles dans le bulletin de sécurité d'octobre de Nvidia.

  • NVIDIA SMI

    NVIDIA-SMI 570.195.03 Driver Version: 570.195.03 CUDA Version: 12.8
  • Versions majeures

    nom du package version
    version_cadre 70
    gdr_copy 2.4.1
    supported_ec2_instances G4dn, G5, G6, G6, G6e, P4d, P4de, P5, P5e, P5en
    efa_version 1,43,3
    type de volume Web gp3
    nvidia_driver 570,195,03
    python_location /usr/bin/python3,10
    nvidia_cuda_stack /usr/local/cuda-12.1,/usr/local/cuda-12.2,/usr/local/cuda-12.3,/usr/local/cuda-12,4
    Version de l'agent SSM 3,3,3050,0
    version_noyau 5.10.244-240.965.amzn2.x86_64
    version de la boîte à outils nvidia_container_toolkit_ 1.17.8
    ofi_nccl_version 1.16,3
    système_exploitation Amazon Linux 2
    cuda par défaut /-12,1/ usr/local/cuda
    architecture_informatique x86_64
  • Packages ajoutés : aucun package n'a été ajouté dans cette version.

  • Packages mis à jour

    nom du package version précédente nouvelle version
    boto3 1,40,46 1,40,49
    botocore 1,40,46 1,40,49
    fastapi 0,118,0 0,118,2
    verrouillage de fichiers 3.19.1 3,20,0
    importlib_metadata 8,7.0 8,0.0
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    matplotlib 3.10.6 3.10.7
    empaquetage 25 24,2
    plate-forme dirs 4.4.0 4.5.0
    propcache 0,4,0 0,4.1
    riche 14.1.0 14.2.0
    tomli 2.2.1 2.3.0
    types-python-dateutil 2,9.0.20250822 2,9.0.20251008
    virtualenv 20,34,0 20,35.1
    client WebSocket 1.8.0 1.9.0
  • Packages supprimés : aucun package n'a été supprimé dans cette version.

AL2023x86

La note de mise à jour du DLAMI de base est disponible ici.

  • Versions EKS 1.28 à 1.32. Aucune sortie pour la version 1.33 d'EKS.

  • Cette version contient des correctifs CVE pour les packages de pilotes NVIDIA concernés, disponibles dans le bulletin de sécurité d'octobre de Nvidia.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • Versions majeures

    nom du package version
    gdr_copy 2.5.1
    supported_ec2_instances G4dn, G5, G6, G6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200
    efa_version 1,43,3
    type de volume Web gp3
    version nvidia_gds 1,15,0,42
    nvidia_driver 580,95,05
    python_location /usr/bin/python3,9
    nvidia_cuda_stack /usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda-13,0
    Version de l'agent SSM 3,3,3050,0
    version_noyau 6,1153-175,280.amzn2023.x86_64
    version de la boîte à outils nvidia_container_toolkit_ 1.17.8
    dcgm_version 4.4.1
    ofi_nccl_version 1.16,3
    système_exploitation Amazon Linux 2023.9.20250929
    cuda par défaut /usr/local/cuda-12,9/
    architecture_informatique x86_64
  • Packages ajoutés : aucun package n'a été ajouté dans cette version.

  • Packages mis à jour

    nom du package version précédente nouvelle version
    boto3 1,40,46 1,40,49
    botocore 1,40,46 1,40,49
    fastapi 0,118,0 0,118,2
    gdrcopy 2,5-1 2.5.1-1
    gdrcopy-devel 2,5-1 2.5.1-1
    gdrcopy-kmod 2,5 à 1 dkms 2.5.1-1dkms
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    plus d'outils 10,8.0 10.3.0
    empaquetage 25 24,2
    propcache 0,4,0 0,4.1
    pydantique 2,1,10 2.12.0
    pydantic_core 2.33.2 2.41.1
    riche 14.1.0 14.2.0
    types-python-dateutil 2,9.0.20250822 2,9.0.20251008
    extensions de saisie 4.12.2 4,15,0
    virtualenv 20,34,0 20,35.1
    client WebSocket 1.8.0 1.9.0
  • Packages supprimés : aucun package n'a été supprimé dans cette version.

AL2023 ARM64

La note de mise à jour du DLAMI de base est disponible ici.

  • Versions d'EKS 1.31 à 1.33.

  • Cette version contient des correctifs CVE pour les packages de pilotes NVIDIA concernés, disponibles dans le bulletin de sécurité d'octobre de Nvidia.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • Versions majeures

    nom du package version
    gdr_copy 2,5
    supported_ec2_instances G5G, P6e-00 GB2
    efa_version 1,43,3
    type de volume Web gp3
    nvidia_driver 580,95,05
    python_location /usr/bin/python3,9
    nvidia_cuda_stack /usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda-13,0
    Version de l'agent SSM 3,3,3050,0
    version_noyau 6.12.46-66.121. amzn2023.aarch64
    version de la boîte à outils nvidia_container_toolkit_ 1.17.8
    dcgm_version 4.4.1
    ofi_nccl_version 1.16,3
    système_exploitation Amazon Linux 2023.9.20250929
    cuda par défaut /usr/local/cuda-12,9/
    architecture_informatique aarch64
  • Packages ajoutés : aucun package n'a été ajouté dans cette version.

  • Packages mis à jour

    nom du package version précédente nouvelle version
    aiohttp 3,12,15 3,13,0
    attrs 25,3,0 25,4.0
    boto3 1,40,45 1,40,49
    botocore 1,40,45 1,40,49
    chattes 25,2,0 25,3,0
    certifi 2025,8.3 2025,1,5
    efa 2.17.2-1. amzn2023 2.17.3-1. amzn2023
    fastapi 0,118,0 0,118,2
    liste gelée 1.7.0 1.8.0
    importlib_metadata 8,7.0 8,0.0
    jaraco.context 5.3.0 6.0.1
    multidict 6.6.4 6.7.0
    narvals 2.6.0 2.7.0
    nh3 0.3.0 0,3.1
    propcache 0,3.2 0,4.1
    pydantique 2,11.9 2.12.0
    pydantic_core 2.33.2 2.41.1
    pylône 3.3.8 3.3.9
    python-json-logger 3.3.0 4.0.0
    riche 14.1.0 14.2.0
    tomli 2.2.1 2.0.1
    types-python-dateutil 2,9.0.20250822 2,9.0.20251008
    virtualenv 20,34,0 20,35.1
    client WebSocket 1.8.0 1.9.0
    yarl 1.20.1 1.22.0
    zipp 3.19,2 3,23,0
  • Packages supprimés : aucun package n'a été supprimé dans cette version.

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 29 septembre 2025

Mises à jour générales de l’AMI

  • Sortie de la nouvelle SageMaker HyperPod AMI pour Amazon EKS 1.33. Pour plus d'informations, consultez les versions de l' SageMaker HyperPod AMI pour Amazon EKS datées du 29 septembre 2025.

    Important
    • L'API Kubernetes bêta d'allocation dynamique des ressources est activée par défaut dans cette version.

      • Cette API améliore la planification et la surveillance des charges de travail qui nécessitent des ressources telles que GPUs.

      • Cette API a été développée par la communauté open source Kubernetes et pourrait changer dans les futures versions de Kubernetes. Avant d'utiliser l'API, consultez la documentation de Kubernetes et comprenez comment elle affecte vos charges de travail.

    • HyperPod ne publie pas d'AMI HyperPod Amazon Linux 2 pour Kubernetes 1.33. AWSvous recommande de migrer vers AL2 023. Pour plus d'informations, consultez la section Mise à niveau d'Amazon Linux 2 vers AL2 023.

Pour plus d'informations, consultez Kubernetes v1.33.

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Cette version inclut les mises à jour suivantes :

Kubernetes v1.28
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • NVIDIA SMI :

    • Version du pilote NVIDIA : 570.172.08

    • Version CUDA : 12.8

  • Packages :

    • Langages et bibliothèques de base :

      • GCC : 11.5.0-5.amzn2023,0.5

      • GCC 14 : 14.2.1-7.amzn2023,0.1

      • Java : 17.0.16+8-1.amzn2023.1

      • Perl : 5.32.1-477.amzn2023.0.7

      • Python : 3.9.23-1.amzn2023.0.3

      • Go : 3.2.0-37.amzn2023

      • Rouille : 1.89.0-1.amzn2023.0.2

    • Bibliothèques principales :

      • GlibC : 2.34-196.amzn2023,0.1

      • OpenSSL : 3.2.2-1.amzn2023.0.1

      • Zlib : 1.2.11-33.amzn2023.0.5

      • Utilitaire XZ : 5.2.5-9.amzn2023.0.2

      • Util-Linux : 2.37.4-1.amzn2023.0.4

    • Neurone :

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • ÉFA :

      • pilote EVA : 2.17.2-1.amzn2023

      • configuration eva : 1.18-1.amzn2023

      • date d'expiration : 1.2.2-1.amzn2023

      • profil efa : 1.7-1.amzn2023

    • noyau :

      • noyau : 6.1.148-173.267.amzn2023

      • développement du noyau : 6.1.148-173.267.amzn2023

      • en-têtes du noyau : 6.1.148-173.267.amzn2023

      • outils du noyau : 6.1.148-173.267.amzn2023

      • modules de noyau supplémentaires : 6.1.148-173.267.amzn2023

      • Livepatch du noyau : 1.0-0.amzn2023

    • Nvidia :

      • boîte à outils pour conteneurs NVIDIA : 1.17.8-1

      • base de la boîte à outils NVIDIA Container : 1.17.8-1

      • libnvidia-container : 1.17.8-1 (avec outils)

      • gestionnaire de tissus NVIDIA : 570.172.08-1

      • libnvidia-nscq : 570.172.08-1

Kubernetes v1.29
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • NVIDIA SMI :

    • Version du pilote NVIDIA : 570.172.08

    • Version CUDA : 12.8

  • Packages :

    • Langages et bibliothèques de base :

      • GCC : 11.5.0-5.amzn2023,0.5

      • GCC 14 : 14.2.1-7.amzn2023,0.1

      • Java : 17.0.16+8-1.amzn2023.1

      • Perl : 5.32.1-477.amzn2023.0.7

      • Python : 3.9.23-1.amzn2023.0.3

      • Go : 3.2.0-37.amzn2023

      • Rouille : 1.89.0-1.amzn2023.0.2

    • Bibliothèques principales :

      • GlibC : 2.34-196.amzn2023,0.1

      • OpenSSL : 3.2.2-1.amzn2023.0.1

      • Zlib : 1.2.11-33.amzn2023.0.5

      • Utilitaire XZ : 5.2.5-9.amzn2023.0.2

      • Util-Linux : 2.37.4-1.amzn2023.0.4

    • Neurone :

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • ÉFA :

      • pilote EVA : 2.17.2-1.amzn2023

      • configuration eva : 1.18-1.amzn2023

      • date d'expiration : 1.2.2-1.amzn2023

      • profil efa : 1.7-1.amzn2023

    • noyau :

      • noyau : 6.1.148-173.267.amzn2023

      • développement du noyau : 6.1.148-173.267.amzn2023

      • en-têtes du noyau : 6.1.148-173.267.amzn2023

      • outils du noyau : 6.1.148-173.267.amzn2023

      • modules de noyau supplémentaires : 6.1.148-173.267.amzn2023

      • Livepatch du noyau : 1.0-0.amzn2023

    • Nvidia :

      • boîte à outils pour conteneurs NVIDIA : 1.17.8-1

      • base de la boîte à outils NVIDIA Container : 1.17.8-1

      • libnvidia-container : 1.17.8-1 (avec outils)

      • gestionnaire de tissus NVIDIA : 570.172.08-1

      • libnvidia-nscq : 570.172.08-1

Kubernetes v1.30
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • NVIDIA SMI :

    • Version du pilote NVIDIA : 570.172.08

    • Version CUDA : 12.8

  • Packages :

    • Langages et bibliothèques de base :

      • GCC : 11.5.0-5.amzn2023,0.5

      • GCC 14 : 14.2.1-7.amzn2023,0.1

      • Java : 17.0.16+8-1.amzn2023.1

      • Perl : 5.32.1-477.amzn2023.0.7

      • Python : 3.9.23-1.amzn2023.0.3

      • Go : 3.2.0-37.amzn2023

      • Rouille : 1.89.0-1.amzn2023.0.2

    • Bibliothèques principales :

      • GlibC : 2.34-196.amzn2023,0.1

      • OpenSSL : 3.2.2-1.amzn2023.0.1

      • Zlib : 1.2.11-33.amzn2023.0.5

      • Utilitaire XZ : 5.2.5-9.amzn2023.0.2

      • Util-Linux : 2.37.4-1.amzn2023.0.4

    • Neurone :

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • ÉFA :

      • pilote EVA : 2.17.2-1.amzn2023

      • configuration eva : 1.18-1.amzn2023

      • date d'expiration : 1.2.2-1.amzn2023

      • profil efa : 1.7-1.amzn2023

    • noyau :

      • noyau : 6.1.148-173.267.amzn2023

      • développement du noyau : 6.1.148-173.267.amzn2023

      • en-têtes du noyau : 6.1.148-173.267.amzn2023

      • outils du noyau : 6.1.148-173.267.amzn2023

      • modules de noyau supplémentaires : 6.1.148-173.267.amzn2023

      • Livepatch du noyau : 1.0-0.amzn2023

    • Nvidia :

      • boîte à outils pour conteneurs NVIDIA : 1.17.8-1

      • base de la boîte à outils NVIDIA Container : 1.17.8-1

      • libnvidia-container : 1.17.8-1 (avec outils)

      • gestionnaire de tissus NVIDIA : 570.172.08-1

      • libnvidia-nscq : 570.172.08-1

Kubernetes v1.31
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • NVIDIA SMI :

    • Version du pilote NVIDIA : 570.172.08

    • Version CUDA : 12.8

  • Packages :

    • Langages et bibliothèques de base :

      • GCC : 11.5.0-5.amzn2023,0.5

      • GCC 14 : 14.2.1-7.amzn2023,0.1

      • Java : 17.0.16+8-1.amzn2023.1

      • Perl : 5.32.1-477.amzn2023.0.7

      • Python : 3.9.23-1.amzn2023.0.3

      • Go : 3.2.0-37.amzn2023

      • Rouille : 1.89.0-1.amzn2023.0.2

    • Bibliothèques principales :

      • GlibC : 2.34-196.amzn2023,0.1

      • OpenSSL : 3.2.2-1.amzn2023.0.1

      • Zlib : 1.2.11-33.amzn2023.0.5

      • Utilitaire XZ : 5.2.5-9.amzn2023.0.2

      • Util-Linux : 2.37.4-1.amzn2023.0.4

    • Neurone :

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • ÉFA :

      • pilote EVA : 2.17.2-1.amzn2023

      • configuration eva : 1.18-1.amzn2023

      • date d'expiration : 1.2.2-1.amzn2023

      • profil efa : 1.7-1.amzn2023

    • noyau :

      • noyau : 6.1.148-173.267.amzn2023

      • développement du noyau : 6.1.148-173.267.amzn2023

      • en-têtes du noyau : 6.1.148-173.267.amzn2023

      • outils du noyau : 6.1.148-173.267.amzn2023

      • modules de noyau supplémentaires : 6.1.148-173.267.amzn2023

      • Livepatch du noyau : 1.0-0.amzn2023

    • Nvidia :

      • boîte à outils pour conteneurs NVIDIA : 1.17.8-1

      • base de la boîte à outils NVIDIA Container : 1.17.8-1

      • libnvidia-container : 1.17.8-1 (avec outils)

      • gestionnaire de tissus NVIDIA : 570.172.08-1

      • libnvidia-nscq : 570.172.08-1

Kubernetes v1.32
  • Amazon Linux 2 est désormais obsolète. L'AMI Kubernetes est basée sur AL2 023.

  • NVIDIA SMI :

    • Version du pilote NVIDIA : 570.172.08

    • Version CUDA : 12.8

  • Packages :

    • Langages et bibliothèques de base :

      • GCC : 11.5.0-5.amzn2023,0.5

      • GCC 14 : 14.2.1-7.amzn2023,0.1

      • Java : 17.0.16+8-1.amzn2023.1

      • Perl : 5.32.1-477.amzn2023.0.7

      • Python : 3.9.23-1.amzn2023.0.3

      • Go : 3.2.0-37.amzn2023

      • Rouille : 1.89.0-1.amzn2023.0.2

    • Bibliothèques principales :

      • GlibC : 2.34-196.amzn2023,0.1

      • OpenSSL : 3.2.2-1.amzn2023.0.1

      • Zlib : 1.2.11-33.amzn2023.0.5

      • Utilitaire XZ : 5.2.5-9.amzn2023.0.2

      • Util-Linux : 2.37.4-1.amzn2023.0.4

    • Neurone :

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • ÉFA :

      • pilote EVA : 2.17.2-1.amzn2023

      • configuration eva : 1.18-1.amzn2023

      • date d'expiration : 1.2.2-1.amzn2023

      • profil efa : 1.7-1.amzn2023

    • noyau :

      • noyau : 6.1.148-173.267.amzn2023

      • développement du noyau : 6.1.148-173.267.amzn2023

      • en-têtes du noyau : 6.1.148-173.267.amzn2023

      • outils du noyau : 6.1.148-173.267.amzn2023

      • modules de noyau supplémentaires : 6.1.148-173.267.amzn2023

      • Livepatch du noyau : 1.0-0.amzn2023

    • Nvidia :

      • boîte à outils pour conteneurs NVIDIA : 1.17.8-1

      • base de la boîte à outils NVIDIA Container : 1.17.8-1

      • libnvidia-container : 1.17.8-1 (avec outils)

      • gestionnaire de tissus NVIDIA : 570.172.08-1

      • libnvidia-nscq : 570.172.08-1

Kubernetes v1.33

Le tableau suivant contient des informations sur les composants de cette version de l'AMI et les versions correspondantes.

component AL2023_x86 AL2023_arm65
EKS v1.33.4 v1.33.4
amazon-ssm-agent 3 mars 2299,0-1 mai 2023 3 mars 2299,0-1 mai 2023
aws-neuronx-dkms 2.23.9.0-dkms N/A
containerd 1.7.27-1.eks.amzn2023,0.4 1.7.27-1.eks.amzn2023,0.4
efa 2.17.2-1. amzn2023 2.17.2-1. amzn2023
ena 2,1,1 g 2,1,1 g
kernel 6.12.40-64,114.amzn2023 N/A
noyau 6.12 N/A 6.12.40-64,114.amzn2023
kmod-nvidia-latest-dkms 570,172.08-1 mai 2023 570.172.08-1.el9
nvidia-container-toolkit 1,17,8-1 1,17,8-1
runc 1.2.6-1.amzn2023,0.1 1.2.6-1.amzn2023,0.1

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 25 août 2025

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Cette version inclut les mises à jour suivantes :

Kubernetes v1.28

NVIDIA SMI :

  • Version du pilote Nvidia : 570.172.08

  • Version CUDA : 12.8

Packages ajoutés :

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Packages mis à jour :

  • gdk-pixbuf2.x86_64 : 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64 : 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64 : 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64 : 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Packages supprimés :

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Référentiel modifié :

  • libnvidia-container-tools.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.29

NVIDIA SMI :

  • Version du pilote Nvidia : 570.172.08

  • Version CUDA : 12.8

Packages ajoutés :

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Packages mis à jour :

  • gdk-pixbuf2.x86_64 : 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64 : 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64 : 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64 : 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Packages supprimés :

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Référentiel modifié :

  • libnvidia-container-tools.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.30

NVIDIA SMI :

  • Version du pilote Nvidia : 570.172.08

  • Version CUDA : 12.8

Packages ajoutés :

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Packages mis à jour :

  • aws-neuronx-dkms.noarch : 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64 : 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64 : 1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64 : 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64 : 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64 : 2,10amzn3.0-1.amzn2 → 2,10amzn5.0-1.amzn2

  • libgs.x86_64 : 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64 : 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64 : 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64 : 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64 : 57 .amzn1-1.amzn2.0.2 → 58 .amzn0-1.amzn2.0.2

Packages supprimés :

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Référentiel modifié :

  • libnvidia-container-tools.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.31

NVIDIA SMI :

  • Version du pilote Nvidia : 570.172.08

  • Version CUDA : 12.8

Packages ajoutés :

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Packages mis à jour :

  • gdk-pixbuf2.x86_64 : 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64 : 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64 : 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64 : 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Packages supprimés :

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Référentiel modifié :

  • libnvidia-container-tools.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.32

NVIDIA SMI :

  • Version du pilote Nvidia : 570.172.08

  • Version CUDA : 12.8

Packages ajoutés :

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Packages mis à jour :

  • aws-neuronx-dkms.noarch : 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64 : 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64 : 1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64 : 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64 : 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64 : 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64 : 2,10amzn3.0-1.amzn2 → 2,10amzn5.0-1.amzn2

  • libgs.x86_64 : 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64 : 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64 : 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64 : 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64 : 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64 : 57 .amzn1-1.amzn2.0.2 → 58 .amzn0-1.amzn2.0.2

Packages supprimés :

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Référentiel modifié :

  • libnvidia-container-tools.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64 : cuda-rhel8-x86_64 → nvidia-container-toolkit

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 12 août 2025

L'AMI inclut les éléments suivants :

  • AWSService pris en charge : Amazon EC2

  • Système d'exploitation : Amazon Linux 2023

  • Architecture informatique : ARM64

  • La dernière version disponible est installée pour les packages suivants :

    • Noyau Linux : 6.12

    • FSx Lustre

    • Docker

    • AWS CLIv2 à /usr/bin/aws

    • NVIDIA DCGM

    • Boîte à outils pour conteneurs Nvidia :

      • Commande de version : nvidia-container-cli -V

    • NVidia-Docker 2 :

      • Commande de version : nvidia-docker version

    • NVidia-IMEX : v570.172.08-1

  • Pilote NVIDIA : 570.158.01

  • Pile NVIDIA CUDA 12,4, 12,5, 12,6, 12,8 :

    • Répertoires d'installation CUDA, NCCL et CudDN : /usr/local/cuda-xx.x/

      • Exemple : /usr/local/cuda-12.8/, /usr/local/cuda-12.8/

    • Version NCCL compilée :

      • Pour le répertoire CUDA de 12.4, compilé la version 2.22.3+ 4 de NCCL CUDA12

      • Pour le répertoire CUDA de 12.5, compilé la version 2.22.3+ .5 de NCCL CUDA12

      • Pour le répertoire CUDA de 12.6, compilé la version NCCL 2.24.3+ .6 CUDA12

      • Pour le répertoire CUDA de 12.8, compilé la version 2.27.5+ de NCCL. CUDA12

    • CUDA par défaut : 12,8

      • PATH /usr/local/cuda pointe vers CUDA 12.8

      • Mise à jour des variables d'environnement ci-dessous :

        • LD_LIBRARY_PATHavoir /usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64

        • PATHavoir /usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/

        • Pour toute version différente de CUDA, veuillez la mettre à jour LD_LIBRARY_PATH en conséquence.

  • Installateur EFA : 1.42.0

  • Nvidia GDRCopy : 2,5.1

  • AWSLe plugin OFI NCCL est fourni avec le programme d'installation EFA

    • Les chemins /opt/amazon/ofi-nccl/lib et /opt/amazon/ofi-nccl/efa sont ajoutés àLD_LIBRARY_PATH.

  • AWS CLIv2 à /usr/local/bin/aws

  • Type de volume EBS : GP3

  • Python: /usr/bin/python3.9

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 6 août 2025

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Ils AMIs incluent les mises à jour suivantes :

K8s v1.28
  • Packages Neuron :

    • aws-neuronx-collectives: 2,27,34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2,27.23,0_8deec4dbf-1

    • aws-neuronx-k8 plugins : 2.27.7.0-1

    • aws-neuronx-kPlanificateur 8 : 2.27.7.0-1

    • aws-neuronx-tools: 2,25,145,0-1

K8s v1.29
  • Packages Neuron :

    • aws-neuronx-collectives: 2,27,34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2,27.23,0_8deec4dbf-1

    • aws-neuronx-k8 plugins : 2.27.7.0-1

    • aws-neuronx-kPlanificateur 8 : 2.27.7.0-1

    • aws-neuronx-tools: 2,25,145,0-1

K8s v1.30
  • Packages Neuron :

    • aws-neuronx-collectives: 2,27,34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2,27.23,0_8deec4dbf-1

    • aws-neuronx-k8 plugins : 2.27.7.0-1

    • aws-neuronx-kPlanificateur 8 : 2.27.7.0-1

    • aws-neuronx-tools: 2,25,145,0-1

K8s v1.31
  • Packages Neuron :

    • aws-neuronx-collectives: 2,27,34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2,27.23,0_8deec4dbf-1

    • aws-neuronx-k8 plugins : 2.27.7.0-1

    • aws-neuronx-kPlanificateur 8 : 2.27.7.0-1

    • aws-neuronx-tools: 2,25,145,0-1

K8s v1.32
  • Packages Neuron :

    • aws-neuronx-collectives: 2,27,34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2,27.23,0_8deec4dbf-1

    • aws-neuronx-k8 plugins : 2.27.7.0-1

    • aws-neuronx-kPlanificateur 8 : 2.27.7.0-1

    • aws-neuronx-tools: 2,25,145,0-1

Important
  • AMI de pilote Nvidia OSS Deep Learning Base (Amazon Linux 2) version 70.3

  • AMI de pilote Nvidia propriétaire Deep Learning Base (Amazon Linux 2) version 68.4

  • Dernière prise en charge CUDA 12.8

  • Mise à niveau du pilote Nvidia de 570.158.01 à 570.172.08 pour corriger les CVE présents dans le bulletin de sécurité Nvidia de juillet

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 31 juillet 2025

Amazon prend SageMaker HyperPod désormais en charge une nouvelle AMI pour les clusters Amazon EKS qui met à jour le système d'exploitation de base vers Amazon Linux 2023. Cette version apporte plusieurs améliorations par rapport à Amazon Linux 2 (AL2). HyperPod publie AMIs régulièrement de nouvelles versions, et nous vous recommandons d'exécuter tous vos HyperPod clusters sur les versions les plus récentes et les plus sécurisées de AMIs afin de corriger les vulnérabilités et de supprimer progressivement les logiciels et bibliothèques obsolètes.

Mises à niveau clés

  • Système d'exploitation : Amazon Linux 2023 (mis à jour depuis Amazon Linux 2, ou AL2)

  • Gestionnaire de packages : DNF est l'outil de gestion de packages par défaut, remplaçant YUM utilisé dans AL2

  • Service réseau : systemd-networkd gère les interfaces réseau, en remplacement de l'ISC dhclient utilisé dans AL2

  • Noyau Linux : version 6.1, mise à jour à partir du noyau utilisé dans AL2

  • Glibc : Version 2.34, mise à jour à partir de la version en AL2

  • GCC : Version 11.5.0, mise à jour à partir de la version en AL2

  • NFS : Version 1:2.6 .1, mise à jour à partir de la version 1:1.3 .4 dans AL2

  • Pilote NVIDIA : version 570.172.08, version plus récente du pilote

  • Python : Version 3.9, remplaçant Python 2.7 utilisé dans AL2

  • NVME : version 1.11.1, une version plus récente du pilote NVMe

Avant la mise à niveau

Il y a quelques points importants à connaître avant de procéder à la mise à niveau. Avec AL2 023, plusieurs packages ont été ajoutés, mis à niveau ou supprimés par rapport à AL2. Nous vous recommandons vivement de tester vos applications avec AL2 023 avant de mettre à niveau vos clusters. Pour obtenir une liste complète de toutes les modifications apportées aux packages en AL2 2023, consultez la section Modifications apportées aux packages dans Amazon Linux 2023.

Voici certains des principaux changements intervenus entre AL2 0 AL2 et 2023 :

  • Python 3.10 : la mise à jour la plus importante, hormis le système d’exploitation, est la mise à niveau de la version de Python. Après la mise à niveau, les clusters utilisent Python 3.10 par défaut. Certaines charges de travail d’entraînement distribuées en Python 3.8 peuvent être compatibles avec Python 3.10, mais nous vous recommandons vivement de tester vos charges de travail spécifiques séparément. Si la migration vers Python 3.10 s’avère difficile mais que vous souhaitez tout de même mettre à niveau votre cluster pour d’autres nouvelles fonctionnalités, vous pouvez installer une ancienne version de Python en utilisant la commande yum install python-xx.x avec des scripts de cycle de vie avant d’exécuter des charges de travail. Assurez-vous de tester la compatibilité de vos scripts de cycle de vie existants et de votre code d’application.

  • Mise en œuvre de l'environnement d'exécution NVIDIA : la version AL2 023 applique strictement les exigences d'exécution des conteneurs NVIDIA, ce qui entraîne l'échec des conteneurs contenant des variables d'environnement NVIDIA codées en dur (par exempleNVIDIA_VISIBLE_DEVICES: "all") sur les nœuds dotés uniquement du processeur (alors que ces paramètres sont AL2 ignorés en l'absence de pilotes GPU). Vous pouvez annuler l’application en définissant NVIDIA_VISIBLE_DEVICES: "void" dans votre spécification de pod ou en utilisant des images de CPU uniquement.

  • cgroup v2 : AL2 023 propose la prochaine génération de hiérarchie de groupes de contrôle unifiée (cgroup v2). cgroup v2 est utilisé pour les exécutions de conteneurs et est également utilisé par. systemd Bien que AL2 023 contienne toujours du code permettant au système de fonctionner à l'aide de cgroup v1, cette configuration n'est pas recommandée.

  • Amazon VPC CNI et eksctl versions : AL2 023 nécessite également que la version de votre Amazon VPC CNI soit 1.16.2 ou supérieure et que votre version soit 0.176.0 ou supérieure. eksctl

  • EFA on FSx for Lustre : vous pouvez désormais utiliser EFA on FSx for Lustre, qui vous permet d'obtenir des performances applicatives comparables à celles des clusters sur site AI/ML ou HPC (calcul haute performance), tout en bénéficiant de l'évolutivité, de la flexibilité et de l'élasticité du cloud computing.

En outre, la mise à niveau vers la version AL2 023 nécessite au minimum la version 1.0.643.0_1.0.192.0 de Health Monitoring Agent. Suivez la procédure ci-dessous pour mettre à jour l’agent de surveillance de l’état :

  1. Si vous utilisez des scripts de HyperPod cycle de vie depuis le GitHub référentiel awsome-distributed-training, veillez à extraire la dernière version. Les versions antérieures ne sont pas compatibles avec AL2 023. Le nouveau script de cycle de vie garantit qu'il containerd utilise le stockage monté supplémentaire pour extraire les images des conteneurs en AL2 023.

  2. Insérez la dernière version du référentiel git de la HyperPod CLI.

  3. Mettez à jour les dépendances à l’aide de la commande suivante : helm dependencies update helm_chart/HyperPodHelmChart

  4. Comme indiqué à l'étape 4 du fichier README de HyperPodHelmChart, exécutez la commande suivante pour mettre à niveau la version des dépendances exécutées sur le cluster : helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system

Charges de travail testées sur les clusters EKS mis à niveau

Voici quelques cas d’utilisation pour lesquels la mise à niveau a été testée :

  • Rétrocompatibilité : les tâches de formation distribuée les plus courantes impliquant PyTorch devraient être rétrocompatibles sur la nouvelle AMI. Toutefois, étant donné que vos charges de travail peuvent dépendre de bibliothèques Python ou Linux spécifiques, nous vous recommandons de commencer par effectuer des tests à plus petite échelle ou sur un sous-ensemble de nœuds avant de mettre à niveau vos clusters plus importants.

  • Tests d'accélérateurs : des tâches sur différents types d'instances, utilisant à la fois les accélérateurs NVIDIA (pour les familles d'instances P et G) et les accélérateurs AWS Neuron (pour les instances Trn) ont été testées.

Comment mettre à niveau votre AMI et les charges de travail associées

Vous pouvez effectuer la mise à niveau vers la nouvelle AMI à l’aide de l’une des méthodes suivantes :

  • Utilisez l’API create-cluster pour créer un nouveau cluster avec l’AMI la plus récente.

  • Utilisez l'update-cluster-softwareAPI pour mettre à niveau votre cluster existant. Notez que cette option réexécute tous les scripts de cycle de vie.

Le cluster est indisponible au cours du processus de mise à jour. Nous vous recommandons de planifier cette durée d’indisponibilité et de redémarrer la charge de travail d’entraînement à partir d’un point de contrôle existant une fois la mise à niveau terminée. En guise de bonne pratique, nous vous recommandons d’effectuer des tests sur un cluster plus petit avant de mettre à niveau vos clusters de plus grande taille.

Si la commande de mise à jour échoue, commencez par identifier la cause de l’échec. En cas d’échec des scripts de cycle de vie, apportez les corrections nécessaires à vos scripts et réessayez. Pour tout autre problème qui ne peut être résolu, contactez AWS Support.

Résolution des problèmes

Utilisez la section suivante pour vous aider à résoudre les problèmes que vous rencontrez lors de la mise à niveau vers la version AL2 023.

Comment corriger des erreurs telles que "nvml error: driver not loaded: unknown" sur des nœuds de cluster de CPU uniquement ?

Si les conteneurs qui fonctionnaient sur les nœuds du processeur AL2 Amazon EKS échouent désormais le AL2 023, il est possible que des variables d'environnement NVIDIA soient codées en dur sur votre image de conteneur. Vous pouvez vérifier la présence de variables d’environnement codées en dur à l’aide de la commande suivante :

docker inspect image:tag | grep -i nvidia

AL2La version 023 applique strictement ces exigences alors qu' AL2 elle était plus indulgente pour les nœuds utilisant uniquement le processeur. L'une des solutions consiste à annuler l'application AL2 023 en définissant certaines variables d'environnement NVIDIA dans les spécifications de votre pod Amazon EKS, comme illustré dans l'exemple suivant :

yaml containers: - name: your-container image: your-image:tag env: - name: NVIDIA_VISIBLE_DEVICES value: "void" - name: NVIDIA_DRIVER_CAPABILITIES value: ""

Une autre alternative consiste à utiliser des images de conteneur de CPU uniquement (telles que pytorch/pytorch:latest-cpu) ou à générer des images personnalisées sans dépendances NVIDIA.

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 15 juillet 2025

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Ils AMIs incluent les mises à jour suivantes :

K8s v1.28
  • Dernier pilote NVIDIA : 550.163.01

  • CUDA par défaut : 12.4

  • Programme d’installation d’EFA : 1.38.0

  • Packages Neuron :

    • aws-neuronx-dkms.noarch : 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64 : 2,4,4,0-1

    • aws-neuronx-tools.x86_64 : 2,18,3,0-1

    • aws-neuron-dkms.noarch : 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64 : 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64 : 1.9.3.0-1

    • aws-neuron-runtime.x86_64 : 1,6,24,0-1

    • aws-neuron-runtime-base.x86_64 : 1,6,21,0-1

    • aws-neuron-tools.x86_64 : 2,14,0-1

    • aws-neuronx-collectives.x86_64 : 2,26,43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64 : 0,2.3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64 : 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64 : 0,16,1,0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64 : 2,26,26,0-1

    • aws-neuronx-k8-scheduler.x86_64 : 2,26,26,0-1

    • aws-neuronx-runtime-lib.x86_64 : 2,26,42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64 : 2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64 : 2,8,0.2.3.0,0-0

    • tensorflow-model-server-neuronx.x86_64 : 2.10.1.2.12,2,0-0

K8s v1.29
  • Version du pilote Nvidia : 550.163.01

  • Version CUDA : 12.4

  • Programme d’installation d’EFA : 1.38.0

  • Packages Neuron :

    • aws-neuronx-dkms.noarch : 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64 : 2,4,4,0-1

    • aws-neuronx-tools.x86_64 : 2,18,3,0-1

    • aws-neuron-dkms.noarch : 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64 : 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64 : 1.9.3.0-1

    • aws-neuron-runtime.x86_64 : 1,6,24,0-1

    • aws-neuron-runtime-base.x86_64 : 1,6,21,0-1

    • aws-neuron-tools.x86_64 : 2,14,0-1

    • aws-neuronx-collectives.x86_64 : 2,26,43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64 : 0,2.3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64 : 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64 : 0,16,1,0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64 : 2,26,26,0-1

    • aws-neuronx-k8-scheduler.x86_64 : 2,26,26,0-1

    • aws-neuronx-runtime-lib.x86_64 : 2,26,42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64 : 2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64 : 2,8,0.2.3.0,0-0

    • tensorflow-model-server-neuronx.x86_64 : 2.10.1.2.12,2,0-0

K8s v1.30
  • Version du pilote Nvidia : 550.163.01

  • Version CUDA : 12.4

  • Version du programme d’installation EFA : 1.38.0

  • Packages Neuron :

    • aws-neuronx-dkms.noarch : 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64 : 2,4,4,0-1

    • aws-neuronx-tools.x86_64 : 2,18,3,0-1

    • aws-neuron-dkms.noarch : 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64 : 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64 : 1.9.3.0-1

    • aws-neuron-runtime.x86_64 : 1,6,24,0-1

    • aws-neuron-runtime-base.x86_64 : 1,6,21,0-1

    • aws-neuron-tools.x86_64 : 2,14,0-1

    • aws-neuronx-collectives.x86_64 : 2,26,43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64 : 0,2.3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64 : 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64 : 0,16,1,0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64 : 2,26,26,0-1

    • aws-neuronx-k8-scheduler.x86_64 : 2,26,26,0-1

    • aws-neuronx-runtime-lib.x86_64 : 2,26,42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64 : 2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64 : 2,8,0.2.3.0,0-0

    • tensorflow-model-server-neuronx.x86_64 : 2.10.1.2.12,2,0-0

K8s v1.31
  • Version du pilote Nvidia : 550.163.01

  • Version CUDA : 12.4

  • Version du programme d’installation EFA : 1.38.0

  • Packages Neuron :

    • aws-neuronx-dkms.noarch : 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64 : 2,4,4,0-1

    • aws-neuronx-tools.x86_64 : 2,18,3,0-1

    • aws-neuron-dkms.noarch : 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64 : 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64 : 1.9.3.0-1

    • aws-neuron-runtime.x86_64 : 1,6,24,0-1

    • aws-neuron-runtime-base.x86_64 : 1,6,21,0-1

    • aws-neuron-tools.x86_64 : 2,14,0-1

    • aws-neuronx-collectives.x86_64 : 2,26,43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64 : 0,2.3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64 : 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64 : 0,16,1,0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64 : 2,26,26,0-1

    • aws-neuronx-k8-scheduler.x86_64 : 2,26,26,0-1

    • aws-neuronx-runtime-lib.x86_64 : 2,26,42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64 : 2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64 : 2,8,0.2.3.0,0-0

    • tensorflow-model-server-neuronx.x86_64 : 2.10.1.2.12,2,0-0

K8s v1.32
  • Version du pilote Nvidia : 550.163.01

  • Version CUDA : 12.4

  • Version du programme d’installation EFA : 1.38.0

  • Packages Neuron :

    • aws-neuronx-dkms.noarch : 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64 : 2,4,4,0-1

    • aws-neuronx-tools.x86_64 : 2,18,3,0-1

    • aws-neuron-dkms.noarch : 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64 : 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64 : 1.9.3.0-1

    • aws-neuron-runtime.x86_64 : 1,6,24,0-1

    • aws-neuron-runtime-base.x86_64 : 1,6,21,0-1

    • aws-neuron-tools.x86_64 : 2,14,0-1

    • aws-neuronx-collectives.x86_64 : 2,26,43,0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64 : 0,2.3,0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64 : 0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64 : 0,16,1,0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64 : 2,26,26,0-1

    • aws-neuronx-k8-scheduler.x86_64 : 2,26,26,0-1

    • aws-neuronx-runtime-lib.x86_64 : 2,26,42,0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64 : 2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64 : 2,8,0.2.3.0,0-0

    • tensorflow-model-server-neuronx.x86_64 : 2.10.1.2.12,2,0-0

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 9 juin 2025

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Neuron SDK Updates
  • aws-neuronx-dkms.noarch : 2.21.37.0 (à partir de 2.20.74.0)

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 22 mai 2025

Mises à jour générales de l’AMI

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Deep Learning Base AMI AL2
  • Dernier pilote NVIDIA : 550.163.01

  • Mises à jour de la pile CUDA :

    • CUDA par défaut : 12.1

    • Version NCCL : 2.22.3

  • Programme d’installation d’EFA : 1.38.0

  • AWSNFC OFI : 1.13.2

  • Noyau Linux : 5.10

  • GDRCopy: 2,4

Important
  • Mise à jour NVIDIA Container Toolkit 1.17.4 : le montage des bibliothèques compatibles CUDA est désormais désactivé.

  • Mises à jour EFA de 1.37 à 1.38 :

    • AWSLe plugin OFI NCCL se trouve désormais dans/-nccl opt/amazon/ofi

    • L'emplacement précédent /opt/aws-ofi-nccl/est obsolète

Neuron SDK Updates
  • aws-neuronx-dkms.noarch : 2.20.74.0 (à partir de 2.20.28.0)

  • aws-neuronx-collectives.x86_64 : 2.25.65.0_9858ac9a1-1 (depuis 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64 : 2.25.57.0_166c7a468-1 (à partir de 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64 : 2.23.9.0 (à partir de 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64 : 0.15.12.0 (à partir du 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64 : 0.15.1.0_5d31b6a3f (à partir de 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64 : 2.25.24.0 (depuis 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64 : 2.25.24.0 (à partir de 2.24.23.0)

Remarques de prise en charge :

  • Les composants de l’AMI, y compris les versions de CUDA, peuvent être supprimés ou modifiés en fonction de la politique de prise en charge du cadre

  • La version du noyau est épinglée pour des raisons de compatibilité. Les utilisateurs doivent éviter les mises à jour, sauf si elles sont requises pour des correctifs de sécurité

  • Pour les EC2 cas avec plusieurs cartes réseau, reportez-vous au guide de configuration EFA pour une configuration appropriée

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 7 mai 2025

Installed the latest version ofAWSNeuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neurone

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 28 avril 2025

Améliorations pour K8s

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Installed the latest version ofAWSNeuron SDK
  • aws-neuronx-dkms.noarch : 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64 : 2,4,4,0-1

  • aws-neuronx-tools.x86_64 : 2,18,3,0-1

  • aws-neuron-dkms.noarch : 2.3.26.0-dkms

  • aws-neuron-k8-plugin.x86_64 : 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64 : 1.9.3.0-1

  • aws-neuron-runtime.x86_64 : 1,6,24,0-1

  • aws-neuron-runtime-base.x86_64 : 1,6,21,0-1

  • aws-neuron-tools.x86_64 : 2,14,0-1

  • aws-neuronx-collectives.x86_64 : 2,24,59,0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64 : 0,2.3,0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64 : 0,14,12,0-1

  • aws-neuronx-gpsimd-tools.x86_64 : 0,14,6,0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64 : 2.24.23,0-1

  • aws-neuronx-k8-scheduler.x86_64 : 2,24.23,0-1

  • aws-neuronx-runtime-lib.x86_64 : 2,24,53,0_f239092cc-1

  • aws-neuronx-tools.x86_64 : 2,22,61,0-1

  • tensorflow-model-server-neuronx.x86_64 : 2.10.1.2.12,2,0-0

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 18 avril 2025

Mises à jour générales de l’AMI

  • Nouvelle SageMaker HyperPod AMI pour Amazon EKS 1.32.1.

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

AMIs Il s'agit notamment des éléments suivants :

Deep Learning EKS AMI 1.32.1
  • Composants Amazon EKS

    • Version de Kubernetes : 1.32.1

    • Version de containerd : 1.7.27

    • Version de runC : 1.1.14

    • AWSAuthentificateur IAM : 0.6.29

  • Amazon SSM Agent : 3.3.1611.0

  • Noyau Linux : 5.10.235

  • Pilote OSS Nvidia : 550.163.01

  • NVIDIA CUDA : 12.4

  • Programme d’installation d’EFA : 1.38.0

  • GDRCopy: 2.4.1-1

  • Kit d’outils pour conteneurs Nvidia : 1.17.6

  • AWSNFC OFI : 1.13.2

  • aws-neuronx-tools: 2,18,3.0

  • aws-neuronx-runtime-lib: 2,24,53,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,20,28,0

  • aws-neuronx-collectives: 2,24,59,0

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 18 février 2025

Améliorations pour K8s

  • Mise à niveau du kit d’outils pour conteneurs Nvidia de la version 1.17.3 à la version 1.17.4.

  • Correction du problème qui empêchait les clients de se connecter aux nœuds après un redémarrage.

  • Mise à niveau de la version Elastic Fabric Adapter (EFA) de 1.37.0 à 1.38.0.

  • L'EFA inclut désormais le plugin AWS OFI NCCL, qui se trouve dans le /opt/amazon/ofi-nccl répertoire au lieu du chemin d'origine/opt/aws-ofi-nccl/. Si vous devez mettre à jour votre variable d’environnement LD_LIBRARY_PATH, assurez-vous de modifier le chemin pour qu’il pointe vers le nouvel emplacement /opt/amazon/ofi-nccl du plug-in OFI NCCL.

  • J'ai supprimé le package Emacs de ceux-ci DLAMIs. Vous pouvez installer emacs depuis GNU emac.

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch : 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64 : 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64 : 2,18.3,0-1 @neuron

  • aws-neuronx-collectives.x86_64 : neurone 2,23.135.0_3e70920f2-1

  • aws-neuronx-gpsimd-customop.x86_64 : 0,2.3.0-1 neurone

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64 : neurone 0,13.2.0_94ba34927-1

  • aws-neuronx-k8-plugin.x86_64 : neurone 2,23,45,0-1

  • aws-neuronx-k8-scheduler.x86_64 : neurone 2,23,45,0-1

  • aws-neuronx-runtime-lib.x86_64 : neurone 2,23.112.0_9b5179492-1

  • aws-neuronx-tools.x86_64 : neurone 2,20.204.0-1

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 22 janvier 2025

Mises à jour générales de l’AMI

  • Nouvelle SageMaker HyperPod AMI pour Amazon EKS 1.31.2.

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

AMIs Il s'agit notamment des éléments suivants :

Deep Learning EKS AMI 1.31
  • Composants Amazon EKS

    • Version de Kubernetes : 1.31.2

    • Version de containerd : 1.7.23

    • Version de runC : 1.1.14

    • AWSAuthentificateur IAM : 0.6.26

  • Amazon SSM Agent : 3.3.987

  • Noyau Linux : 5.10.230

  • Pilote OSS Nvidia : 550.127.05

  • NVIDIA CUDA : 12.4

  • Programme d’installation d’EFA : 1.37.0

  • GDRCopy: 2.4.1-1

  • Kit d’outils pour conteneurs Nvidia: 1.17.3

  • AWSNFC OFI : 1.13.0

  • aws-neuronx-tools: 2,18,3

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,13,0

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 21 décembre 2024

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

AMIs Il s'agit notamment des éléments suivants :

K8s v1.28
  • Composants Amazon EKS

    • Version de Kubernetes : 1.28.15

    • Version de containerd : 1.7.23

    • Version de runC : 1.1.14

    • AWSAuthentificateur IAM : 0.6.26

  • Amazon SSM Agent : 3.3.987

  • Noyau Linux : 5.10.228

  • Pilote OSS NVIDIA : 550.127.05

  • NVIDIA CUDA : 12.4

  • Programme d’installation d’EFA : 1.37.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs NVIDIA : 1.17.3

  • AWSNFC OFI : 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.29
  • Composants Amazon EKS

    • Version de Kubernetes : 1.29.10

    • Version de containerd : 1.7.23

    • Version de runC : 1.1.14

    • AWSAuthentificateur IAM : 0.6.26

  • Amazon SSM Agent : 3.3.987

  • Noyau Linux : 5.15.0

  • Pilote OSS Nvidia : 550.127.05

  • NVIDIA CUDA : 12.4

  • Programme d’installation d’EFA : 1.37.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs Nvidia: 1.17.3

  • AWSNFC OFI : 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.30
  • Composants Amazon EKS

    • Version de Kubernetes : 1.30.6

    • Version de containerd : 1.7.23

    • Version de runC : 1.1.14

    • AWSAuthentificateur IAM : 0.6.26

  • Amazon SSM Agent : 3.3.987.0

  • Noyau Linux : 5.10.228

  • Pilote OSS Nvidia : 550.127.05

  • NVIDIA CUDA : 12.4

  • Programme d’installation d’EFA : 1.37.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs Nvidia: 1.17.3

  • AWSNFC OFI : 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 13 décembre 2024

SageMaker HyperPod DLAMI pour la mise à niveau d'Amazon EKS

  • Mise à jour de SSM Agent vers la version 3.3.1311.0.

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 24 novembre 2024

Mises à jour générales de l’AMI

  • Publication dans la région MEL (Melbourne).

  • DLAMI SageMaker HyperPod de base mis à jour vers les versions suivantes :

    • Kubernetes : 2024-11-01.

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 15 novembre 2024

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

AMIs Il s'agit notamment des éléments suivants :

Deep Learning EKS AMI 1.28
  • Composants Amazon EKS

    • Version de Kubernetes : 1.28.15

    • Version de containerd : 1.7.23

    • Version de runC : 1.1.14

    • AWSAuthentificateur IAM : 0.6.26

  • Amazon SSM Agent : 3.3.987

  • Noyau Linux : 5.10.228

  • Pilote OSS NVIDIA : 550.127.05

  • NVIDIA CUDA : 12.4

  • Programme d’installation d’EFA : 1.34.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs NVIDIA : 1.17.3

  • AWSNFC OFI : 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,22,19,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22.33.0

Deep Learning EKS AMI 1.29
  • Composants Amazon EKS

    • Version de Kubernetes : 1.29.10

    • Version de containerd : 1.7.23

    • Version de runC : 1.1.14

    • AWSAuthentificateur IAM : 0.6.26

  • Amazon SSM Agent : 3.3.987

  • Noyau Linux : 5.10.228

  • Pilote OSS Nvidia : 550.127.05

  • NVIDIA CUDA : 12.4

  • Programme d’installation d’EFA : 1.34.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs Nvidia: 1.17.3

  • AWSNFC OFI : 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,22,19,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22.33.0

Deep Learning EKS AMI 1.30
  • Composants Amazon EKS

    • Version de Kubernetes : 1.30.6

    • Version de containerd : 1.7.23

    • Version de runC : 1.1.14

    • AWSAuthentificateur IAM : 0.6.26

  • Amazon SSM Agent : 3.3.987

  • Noyau Linux : 5.10.228

  • Pilote OSS Nvidia : 550.127.05

  • NVIDIA CUDA : 12.4

  • Programme d’installation d’EFA : 1.34.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs Nvidia: 1.17.3

  • AWSNFC OFI : 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,22,19,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22.33.0

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 11 novembre 2024

Mises à jour générales de l’AMI

  • SageMaker HyperPod DLAMI mis à jour avec les versions 1.28.13, 1.29.8, 1.30.4 d'Amazon EKS.

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 21 octobre 2024

Mises à jour générales de l’AMI

  • DLAMI SageMaker HyperPod de base mis à jour vers les versions suivantes :

    • Amazon EKS : 1.28.11, 1.29.6, 1.30.2.

SageMaker HyperPod Publications d'AMI pour Amazon EKS : 10 septembre 2024

SageMaker HyperPod Assistance DLAMI pour Amazon EKS

AMIs Il s'agit notamment des éléments suivants :

Deep Learning EKS AMI 1.28
  • Composants Amazon EKS

    • Version de Kubernetes : 1.28.11

    • Version de containerd : 1.7.20

    • Version de runC : 1.1.11

    • AWSAuthentificateur IAM : 0.6.21

  • Amazon SSM Agent : 3.3.380

  • Noyau Linux : 5.10.223

  • Pilote OSS NVIDIA : 535.183.01

  • NVIDIA CUDA : 12.2

  • Programme d’installation d’EFA : 1.32.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs NVIDIA : 1.16.1

  • AWSOFI NCCL : 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21.41,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,17,17,0

  • aws-neuronx-collectives: 2,21.46,0

Deep Learning EKS AMI 1.29
  • Composants Amazon EKS

    • Version de Kubernetes : 1.29.6

    • Version de containerd : 1.7.20

    • Version de runC : 1.1.11

    • AWSAuthentificateur IAM : 0.6.21

  • Amazon SSM Agent : 3.3.380

  • Noyau Linux : 5.10.223

  • Pilote OSS Nvidia : 535.183.01

  • NVIDIA CUDA : 12.2

  • Programme d’installation d’EFA : 1.32.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs Nvidia : 1.16.1

  • AWSOFI NCCL : 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21.41,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,17,17,0

  • aws-neuronx-collectives: 2,21.46,0

Deep Learning EKS AMI 1.30
  • Composants Amazon EKS

    • Version de Kubernetes : 1.30.2

    • Version de containerd : 1.7.20

    • Version de runC : 1.1.11

    • AWSAuthentificateur IAM : 0.6.21

  • Amazon SSM Agent : 3.3.380

  • Noyau Linux : 5.10.223

  • Pilote OSS Nvidia : 535.183.01

  • NVIDIA CUDA : 12.2

  • Programme d’installation d’EFA : 1.32.0

  • GDRCopy: 2,4

  • Kit d’outils pour conteneurs Nvidia : 1.16.1

  • AWSOFI NCCL : 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21.41,0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2,17,17,0

  • aws-neuronx-collectives: 2,21.46,0