SageMaker HyperPod Lançamentos da AMI para o Amazon EKS - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS

As notas de lançamento a seguir acompanham as atualizações mais recentes dos lançamentos do Amazon SageMaker HyperPod AMI para orquestração do Amazon EKS. Cada nota de lançamento inclui uma lista resumida de pacotes pré-instalados ou pré-configurados no suporte do SageMaker HyperPod DLAMIs Amazon EKS. Cada DLAMI é construído em 023 e é compatível AL2 com uma versão específica do Kubernetes. Para versões HyperPod do DLAMI para orquestração do Slurm, consulte. SageMaker HyperPod Lançamentos da AMI para o Slurm Para obter informações sobre os lançamentos de SageMaker HyperPod recursos da Amazon, consulteNotas SageMaker HyperPod de lançamento da Amazon.

SageMaker Lançamentos do Hyperpod AMI para o Amazon EKS: 22 de novembro de 2025

Atualizações gerais de AMI

SageMaker Suporte ao Hyperpod DLAMI para Amazon EKS

Esta versão inclui as seguintes alterações:

Kubernetes v1.28
  • AL2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do kernel Linux: 5.10

    • Versão Glibc: 2.26

    • Versão OpenSSL: 1.0.2k-fips

    • FSx Versão do Lustre Client: 2.12.8

    • Versão Docker: Docker versão 25.0.13, compilação 0bab007

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão AWS CLI v2: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 570.195.03

    • Versão do CUDA: 12.2

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.7.16

    • Versão do Kubernetes: v1.28.15-eks-473151a

    • versão iptables-services: 1.8.4

    • versão nginx: 1.20.1

    • versão nvme-cli: 1.11.1

    • versão epel-release: 7

    • versão de stress: 1.0.4

    • versão coletada: 5.8.1

    • versão acl: 2.2.51

    • versão rsyslog: 8.24.0

    • versão lustre-client: 2.12.8

    • versão systemd: 219

    • versão openssh: 7.4

    • versão sudo: 1.8.23

    • versão gcc: 7.3.1

    • versão cmake: 2.8.12.2

    • versão git: 2.47.3

    • versão make: 3.82

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 1.3.0

    • versão lvm2:2.02.187

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

  • AL2023 (x86_64):

    • Versão do kernel Linux: 6.1

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.28.15-eks-473151a

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

Kubernetes v1.29
  • AL2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do kernel Linux: 5.10

    • Versão Glibc: 2.26

    • Versão OpenSSL: 1.0.2k-fips

    • FSx Versão do Lustre Client: 2.12.8

    • Versão Docker: Docker versão 25.0.13, compilação 0bab007

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão AWS CLI v2: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 570.195.03

    • Versão do CUDA: 12.2

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.7.16

    • Versão do Kubernetes: v1.29.15-eks-473151a

    • versão iptables-services: 1.8.4

    • versão nginx: 1.20.1

    • versão nvme-cli: 1.11.1

    • versão epel-release: 7

    • versão de stress: 1.0.4

    • versão coletada: 5.8.1

    • versão acl: 2.2.51

    • versão rsyslog: 8.24.0

    • versão lustre-client: 2.12.8

    • versão systemd: 219

    • versão openssh: 7.4

    • versão sudo: 1.8.23

    • versão gcc: 7.3.1

    • versão cmake: 2.8.12.2

    • versão git: 2.47.3

    • versão make: 3.82

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 1.3.0

    • versão lvm2:2.02.187

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

  • AL2023 (x86_64):

    • Versão do kernel Linux: 6.1

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.29.15-eks-473151a

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

Kubernetes v1.30
  • AL2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do kernel Linux: 5.10

    • Versão Glibc: 2.26

    • Versão OpenSSL: 1.0.2k-fips

    • FSx Versão do Lustre Client: 2.12.8

    • Versão Docker: Docker versão 25.0.13, compilação 0bab007

    • Versão Runc: 1.3.2

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão AWS CLI v2: aws-cli/1.42.69 Python/3.10.17 Linux/5.10.245-241.976.amzn2.x86_64 botocore/1.40.69

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 570.195.03

    • Versão do CUDA: 12.2

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.7.16

    • Versão do Kubernetes: v1.30.11-eks-473151a

    • versão iptables-services: 1.8.4

    • versão nginx: 1.20.1

    • versão nvme-cli: 1.11.1

    • versão epel-release: 7

    • versão de stress: 1.0.4

    • versão coletada: 5.8.1

    • versão acl: 2.2.51

    • versão rsyslog: 8.24.0

    • versão lustre-client: 2.12.8

    • versão systemd: 219

    • versão openssh: 7.4

    • versão sudo: 1.8.23

    • versão gcc: 7.3.1

    • versão cmake: 2.8.12.2

    • versão git: 2.47.3

    • versão make: 3.82

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 1.3.0

    • versão lvm2:2.02.187

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 58.

  • AL2023 (x86_64):

    • Versão do kernel Linux: 6.1

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.30.11-eks-473151a

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

Kubernetes v1.31
  • AL2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do kernel Linux: 5.10

    • Versão Glibc: 2.26

    • Versão OpenSSL: 1.0.2k-fips

    • FSx Versão do Lustre Client: 2.12.8

    • Versão Docker: Docker versão 25.0.13, compilação 0bab007

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão AWS CLI v2: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 570.195.03

    • Versão do CUDA: 12.2

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.7.16

    • Versão do Kubernetes: v1.31.7-eks-473151a

    • versão iptables-services: 1.8.4

    • versão nginx: 1.20.1

    • versão nvme-cli: 1.11.1

    • versão epel-release: 7

    • versão de stress: 1.0.4

    • versão coletada: 5.8.1

    • versão acl: 2.2.51

    • versão rsyslog: 8.24.0

    • versão lustre-client: 2.12.8

    • versão systemd: 219

    • versão openssh: 7.4

    • versão sudo: 1.8.23

    • versão gcc: 7.3.1

    • versão cmake: 2.8.12.2

    • versão git: 2.47.3

    • versão make: 3.82

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 1.3.0

    • versão lvm2:2.02.187

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

  • AL2023 (x86_64):

    • Versão do kernel Linux: 6.1

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.31.13-eks-113cf36

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

  • AL2203 (ARM64):

    • Versão do kernel Linux: 6.12

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.31.13-eks-113cf36

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • Versão nvidia-imex: 580.95.05

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 58.

Kubernetes v1.32
  • AL2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do kernel Linux: 5.10

    • Versão Glibc: 2.26

    • Versão OpenSSL: 1.0.2k-fips

    • FSx Versão do Lustre Client: 2.12.8

    • Versão Docker: Docker versão 25.0.13, compilação 0bab007

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão AWS CLI v2: aws-cli/1.42.74 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.74

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 570.195.03

    • Versão do CUDA: 12.2

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.7.16

    • Versão do Kubernetes: v1.32.3-eks-473151a

    • versão iptables-services: 1.8.4

    • versão nginx: 1.20.1

    • versão nvme-cli: 1.11.1

    • versão epel-release: 7

    • versão de stress: 1.0.4

    • versão coletada: 5.8.1

    • versão acl: 2.2.51

    • versão rsyslog: 8.24.0

    • versão lustre-client: 2.12.8

    • versão systemd: 219

    • versão openssh: 7.4

    • versão sudo: 1.8.23

    • versão gcc: 7.3.1

    • versão cmake: 2.8.12.2

    • versão git: 2.47.3

    • versão make: 3.82

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 1.3.0

    • versão lvm2:2.02.187

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

  • AL2023 (x86_64):

    • Versão do kernel Linux: 6.1

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.32.9-eks-113cf36

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

  • AL2203 (ARM64):

    • Versão do kernel Linux: 6.12

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.32.9-eks-113cf36

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • Versão nvidia-imex: 580.95.05

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 58.

Kubernetes v1.33
  • AL2023 (x86_64):

    • Versão do kernel Linux: 6.1

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • versão do aws Neuronx DMS: 2.24.7.0

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.33.5-eks-113cf36

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 59.

  • AL2203 (ARM64):

    • Versão do kernel Linux: 6.12

    • Versão Glibc: 2.34

    • Versão do OpenSSL: 3.2.2

    • FSx Versão do Lustre Client: 2.15.6

    • Versão Runc: 1.3.3

    • Versão em contêiner: containerd github. com/containerd/containerd 1.7.27

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 12.8

    • Versão do driver ENA: 2.15.0g

    • Versão Python: 3.9.24

    • Versão do Kubernetes: v1.33.5-eks-113cf36

    • versão iptables-services: 1.8.8

    • versão nginx: 1.28.0

    • versão nvme-cli: 2.13 1.13

    • versão de stress: 1.0.7

    • versão coletada: 5.12.0.

    • versão acl: 2.3.1

    • versão lustre-client: 2.15.6

    • Versão nvidia-imex: 580.95.05

    • versão systemd: 252

    • versão openssh: 8.7

    • versão sudo: 1.9.15

    • versão gcc: 11.5.0

    • versão cmake: 3.2.2

    • versão git: 2.50.1

    • versão make: 4.3

    • versão do cloudwatch-agent: 1.300060.1

    • versão nfs-utils: 2.5.4

    • versão lvm2:2.03.16

    • versão ec2-instance-connect: 1.1

    • aws-cfn-bootstrap versão: 2.0

    • versão rdma-core: 58.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 07 de novembro de 2025

Atualizações gerais de AMI

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Esta versão inclui as seguintes alterações:

Kubernetes v1.28
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.28.15

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.28.15

  • As atualizações do pacote incluem componentes do kit de ferramentas de contêiner boto3, botocore, pip, regex, psutil e nvidia.

  • Pacote adicionado: annotated-doc 0.0.3

Kubernetes v1.29
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.29.15

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.29.15

  • As atualizações de pacotes incluem atualizações do kernel, atualizações da glibc e várias bibliotecas do sistema.

  • Pacote adicionado: annotated-doc 0.0.3

Kubernetes v1.30
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.30.11

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.30.11

  • As atualizações de pacotes incluem atualizações do livepatch do kernel e atualizações da biblioteca do sistema.

  • Pacote adicionado: annotated-doc 0.0.3

Kubernetes v1.31
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.31.7

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.31.13

  • AL2023 (braço):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.31.13

    • Versão do kernel: 6.12.46-66.121.amzn2023.aarch64

  • As atualizações do Package incluem extensas atualizações da biblioteca do sistema, atualizações do kernel e atualizações da biblioteca Boost.

  • Pacotes adicionados:, apr-util-lmdb kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.32.3

    • AWS Versão do IAM Authenticator: v0.6.29

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.32.9

  • AL2023 (braço):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.32.9

    • Versão do kernel: 6.12.46-66.121.amzn2023.aarch64

  • As atualizações de pacotes incluem atualizações do livepatch do kernel e atualizações da biblioteca do sistema.

  • Pacote adicionado: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.33.5

    • Versão do kernel: 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (braço):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.33.5

    • Versão do kernel: 6.12.46-66.121.amzn2023.aarch64

  • As atualizações do Package incluem extensas atualizações da biblioteca do sistema, atualizações do kernel e atualizações da biblioteca Boost.

  • Pacotes adicionados: atualizações apr-util-lmdb do kernel-livepatch

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 29 de outubro de 2025

Atualizações gerais de AMI

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Esta versão inclui as seguintes alterações:

Kubernetes v1.28
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.28.15

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.28.15

  • As atualizações do pacote incluem componentes do kit de ferramentas de contêiner boto3, botocore, pip, regex, psutil e nvidia.

  • Pacote adicionado: annotated-doc 0.0.3

Kubernetes v1.29
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.29.15

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.29.15

  • As atualizações de pacotes incluem atualizações do kernel, atualizações da glibc e várias bibliotecas do sistema.

  • Pacote adicionado: annotated-doc 0.0.3

Kubernetes v1.30
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.30.11

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.30.11

  • As atualizações de pacotes incluem atualizações do livepatch do kernel e atualizações da biblioteca do sistema.

  • Pacote adicionado: annotated-doc 0.0.3

Kubernetes v1.31
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.31.7

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.31.13

  • AL2023 (braço):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.31.13

    • Versão do kernel: 6.12.46-66.121.amzn2023.aarch64

  • As atualizações do Package incluem extensas atualizações da biblioteca do sistema, atualizações do kernel e atualizações da biblioteca Boost.

  • Pacotes adicionados:, apr-util-lmdb kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • AL2 (x86_64):

    • Versão do driver NVIDIA: 570.195.03

    • Versão CUDA: 12.8

    • Versão do Kubernetes: 1.32.3

  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.32.9

  • AL2023 (braço):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.32.9

    • Versão do kernel: 6.12.46-66.121.amzn2023.aarch64

  • As atualizações de pacotes incluem atualizações do livepatch do kernel e atualizações da biblioteca do sistema.

  • Pacote adicionado: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.33.5

    • Versão do kernel: 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (braço):

    • Versão do driver NVIDIA: 580.95.05

    • Versão CUDA: 13.0

    • Versão do Kubernetes: 1.33.5

    • Versão do kernel: 6.12.46-66.121.amzn2023.aarch64

  • As atualizações do Package incluem extensas atualizações da biblioteca do sistema, atualizações do kernel e atualizações da biblioteca Boost.

  • Pacotes adicionados: atualizações apr-util-lmdb do kernel-livepatch

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 22 de outubro de 2025

AL2x86

nota

O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em AL2 023.

A nota de lançamento do DLAMI base está disponível aqui.

  • Versões EKS 1.28 - 1.32

  • Esta versão contém patches CVE para pacotes de drivers NVIDIA afetados encontrados no Boletim de Segurança de outubro da Nvidia.

  • NVIDIA SMI

    NVIDIA-SMI 570.195.03 Driver Version: 570.195.03 CUDA Version: 12.8
  • Versões principais

    nome do pacote version
    versão_estrutura 70
    gdr_copy 2.4.1
    instâncias_ec2 suportadas G4dn, G5, G6, G6, G6e, P4d, P4de, P5, P5e, P5en
    versão efa_ 1.43.3
    tipo_de_volume ebs gp3
    NVIDIA_DRIVER 570.195,03
    localização_python /usr/bin/python3,10
    nvidia_cuda_stack /usr/local/cuda-12.1,/usr/local/cuda-12.2,/usr/local/cuda-12.3,/usr/local/cuda-12,4
    versão_ssm_agent_ 3.3.3050.0
    versão_kernel 5.10.244-240.965.amzn2.x86_64
    versão do kit de ferramentas nvidia_container_ 1.17.8
    versão ofi_nccl 1.16.3
    sistema_operacional Amazon Linux 2
    default_cuda /usr/local/cuda-12,1/
    arquitetura_computacional x86_64
  • Pacotes adicionados: nenhum pacote foi adicionado nesta versão.

  • Pacotes atualizados

    nome do pacote versão anterior nova versão
    boto3 1.40.46 1.40.49
    botocore 1.40.46 1.40.49
    API rápida 0,118.0 0,118.2
    bloqueio de arquivo 3.19.1 3.20.0
    importlib_metadata 8.7.0 8.0.0
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    matplotlib 3.10.6 3.10.7
    empacotamento 25 24,2
    diretórios de plataforma 4.4.0 4.5.0
    cache de props 0.4.0 0.4.1
    rico 14.1.0 14.2.0
    tomli 2.2.1 2.3.0
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    virtualenv 20.34,0 20.35.1
    cliente websocket 1.8.0 1.9.0
  • Pacotes removidos: nenhum pacote foi removido nesta versão.

AL2203x86

A nota de lançamento do DLAMI base está disponível aqui.

  • Versões EKS 1.28 - 1.32. Nenhuma versão para a versão 1.33 do EKS.

  • Esta versão contém patches CVE para pacotes de drivers NVIDIA afetados encontrados no Boletim de Segurança de outubro da Nvidia.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • Versões principais

    nome do pacote version
    gdr_copy 2.5.1
    instâncias_ec2 suportadas G4dn, G5, G6, G6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200
    versão efa_ 1.43.3
    tipo_de_volume ebs gp3
    versão nvidia_gds 1.15.0.42
    NVIDIA_DRIVER 580.95,05
    localização_python /usr/bin/python3,9
    nvidia_cuda_stack /usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda-13,0
    versão_ssm_agent_ 3.3.3050.0
    versão_kernel 6.1.153-175.280.amzn2023.x86_64
    versão do kit de ferramentas nvidia_container_ 1.17.8
    versão_dcgm 4.4.1
    versão ofi_nccl 1.16.3
    sistema_operacional Amazon Linux 2023.9.20250929
    default_cuda /usr/local/cuda-12,9/
    arquitetura_computacional x86_64
  • Pacotes adicionados: nenhum pacote foi adicionado nesta versão.

  • Pacotes atualizados

    nome do pacote versão anterior nova versão
    boto3 1.40.46 1.40.49
    botocore 1.40.46 1.40.49
    API rápida 0,118.0 0,118.2
    gdrcopy 2,5-1 2.5.1-1
    nível de grcopia 2,5-1 2.5.1-1
    gdrcopy-kmod 2,5-1 dkms 2.5.1-1 dkms
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    mais ferramentas de iteração 10.8.0 10.3.0
    empacotamento 25 24,2
    cache de props 0.4.0 0.4.1
    pidântico 2.11.10 2.12.0
    núcleo pneumático 2.3.2 2.41.1
    rico 14.1.0 14.2.0
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    extensões_de_digitação 4.12.2 4.15.0
    virtualenv 20.34,0 20.35.1
    cliente websocket 1.8.0 1.9.0
  • Pacotes removidos: nenhum pacote foi removido nesta versão.

AL2023 ARM64

A nota de lançamento do DLAMI base está disponível aqui.

  • Versões EKS 1.31 - 1.33.

  • Esta versão contém patches CVE para pacotes de drivers NVIDIA afetados encontrados no Boletim de Segurança de outubro da Nvidia.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • Versões principais

    nome do pacote version
    gdr_copy 2,5
    instâncias_ec2 suportadas 5G, P6-00 GB2
    versão efa_ 1.43.3
    tipo_de_volume ebs gp3
    NVIDIA_DRIVER 580.95,05
    localização_python /usr/bin/python3,9
    nvidia_cuda_stack /usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda-13,0
    versão_ssm_agent_ 3.3.3050.0
    versão_kernel 6.12.46-66.121.amzn2023.aarch64
    versão do kit de ferramentas nvidia_container_ 1.17.8
    versão_dcgm 4.4.1
    versão ofi_nccl 1.16.3
    sistema_operacional Amazon Linux 2023.9.20250929
    default_cuda /usr/local/cuda-12,9/
    arquitetura_computacional aarch64
  • Pacotes adicionados: nenhum pacote foi adicionado nesta versão.

  • Pacotes atualizados

    nome do pacote versão anterior nova versão
    aiohttp 3.12.15 3.13.0
    atrai 25.3.0 25.4.0
    boto3 1.40.45 1.40.49
    botocore 1.40.45 1.40.49
    catters 25.2.0 25.3.0
    certifi 2025.8.3 2025.10.5
    efa 2.17.2-1.amzn2023 2.17.3-1.amzn2023
    API rápida 0,118.0 0,118.2
    lista congelada 1.7.0 1.8.0
    importlib_metadata 8.7.0 8.0.0
    jaraco.context 5.3.0 6.0.1
    multidito 6.6.4 6.7.0
    narvais 2.6.0 2.7.0
    nh3 0.3.0 0.3.1
    cache de props 0.3.2 0.4.1
    pidântico 2.11.9 2.12.0
    núcleo pneumático 2.3.2 2.41.1
    pilão 3.3.8 3.3.9
    python-json-logger 3.3.0 4.0.0
    rico 14.1.0 14.2.0
    tomli 2.2.1 2.0.1
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    virtualenv 20.34,0 20.35.1
    cliente websocket 1.8.0 1.9.0
    fio 1.20.1 1.22.0
    zíper 3.19.2 3.23,0
  • Pacotes removidos: nenhum pacote foi removido nesta versão.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 29 de setembro de 2025

Atualizações gerais de AMI

  • Lançou a nova SageMaker HyperPod AMI para o Amazon EKS 1.33. Para obter mais informações, consulte Versões da SageMaker HyperPod AMI para o Amazon EKS: 29 de setembro de 2025.

    Importante
    • A API beta do Kubernetes de alocação dinâmica de recursos está ativada por padrão nesta versão.

      • Essa API melhora o agendamento e o monitoramento de cargas de trabalho que exigem recursos como. GPUs

      • Essa API foi desenvolvida pela comunidade de código aberto do Kubernetes e pode mudar em versões futuras do Kubernetes. Antes de usar a API, revise a documentação do Kubernetes e entenda como ela afeta suas cargas de trabalho.

    • HyperPod não está lançando uma AMI HyperPod Amazon Linux 2 para Kubernetes 1.33. AWS recomenda que você migre para AL2 023. Para obter mais informações, consulte Atualização do Amazon Linux 2 para o AL2 023.

Para obter mais informações, consulte Kubernetes v1.33.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Esta versão inclui as seguintes alterações:

Kubernetes v1.28
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • NVIDIA SMI:

    • Versão do driver NVIDIA: 570.172.08

    • Versão CUDA: 12.8

  • Pacotes:

    • Linguagens e bibliotecas principais:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Para: 3.2.0-37.amzn2023

      • Ferrugem: 1.89.0-1.amzn2023.0.2

    • Bibliotecas principais:

      • GLiBC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Versão: 1.2.11-33.amzn2023.0.5

      • Utilitários do ZZ: 5.2.5-9.amzn2023.0.2

      • UTIL-Linux: 2.37.4-1.amzn2023.0.4

    • Neurônio:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • driver eva: 2.17.2-1.amzn2023

      • configuração efa: 1.18-1.amzn2023

      • Tempo de espera: 1.2.2-1.amzn2023

      • Perfil do efa: 1.7-1.amzn2023

    • núcleo:

      • kernel: 6.1.148-173.267.amzn2023

      • desenvolvimento do kernel: 6.1.148-173.267.amzn2023

      • cabeçalhos do kernel: 6.1.148-173.267.amzn2023

      • ferramentas do kernel: 6.1.148-173.267.amzn2023

      • módulos de kernel extras: 6.1.148-173.267.amzn2023

      • live patch do kernel: 1.0-0.amzn2023

    • Nvidia:

      • kit de ferramentas de contêiner nvidia: 1.17.8-1

      • base do kit de ferramentas de contêiner nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (com ferramentas)

      • gerenciador de estrutura nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.29
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • NVIDIA SMI:

    • Versão do driver NVIDIA: 570.172.08

    • Versão CUDA: 12.8

  • Pacotes:

    • Linguagens e bibliotecas principais:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Para: 3.2.0-37.amzn2023

      • Ferrugem: 1.89.0-1.amzn2023.0.2

    • Bibliotecas principais:

      • GLiBC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Versão: 1.2.11-33.amzn2023.0.5

      • Utilitários do ZZ: 5.2.5-9.amzn2023.0.2

      • UTIL-Linux: 2.37.4-1.amzn2023.0.4

    • Neurônio:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • driver eva: 2.17.2-1.amzn2023

      • configuração efa: 1.18-1.amzn2023

      • Tempo de espera: 1.2.2-1.amzn2023

      • Perfil do efa: 1.7-1.amzn2023

    • núcleo:

      • kernel: 6.1.148-173.267.amzn2023

      • desenvolvimento do kernel: 6.1.148-173.267.amzn2023

      • cabeçalhos do kernel: 6.1.148-173.267.amzn2023

      • ferramentas do kernel: 6.1.148-173.267.amzn2023

      • módulos de kernel extras: 6.1.148-173.267.amzn2023

      • live patch do kernel: 1.0-0.amzn2023

    • Nvidia:

      • kit de ferramentas de contêiner nvidia: 1.17.8-1

      • base do kit de ferramentas de contêiner nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (com ferramentas)

      • gerenciador de estrutura nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.30
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • NVIDIA SMI:

    • Versão do driver NVIDIA: 570.172.08

    • Versão CUDA: 12.8

  • Pacotes:

    • Linguagens e bibliotecas principais:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Para: 3.2.0-37.amzn2023

      • Ferrugem: 1.89.0-1.amzn2023.0.2

    • Bibliotecas principais:

      • GLiBC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Versão: 1.2.11-33.amzn2023.0.5

      • Utilitários XZ: 5.2.5-9.amzn2023.0.2

      • UTIL-Linux: 2.37.4-1.amzn2023.0.4

    • Neurônio:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • driver eva: 2.17.2-1.amzn2023

      • configuração efa: 1.18-1.amzn2023

      • Tempo de espera: 1.2.2-1.amzn2023

      • Perfil do efa: 1.7-1.amzn2023

    • núcleo:

      • kernel: 6.1.148-173.267.amzn2023

      • desenvolvimento do kernel: 6.1.148-173.267.amzn2023

      • cabeçalhos do kernel: 6.1.148-173.267.amzn2023

      • ferramentas do kernel: 6.1.148-173.267.amzn2023

      • módulos de kernel extras: 6.1.148-173.267.amzn2023

      • live patch do kernel: 1.0-0.amzn2023

    • Nvidia:

      • kit de ferramentas de contêiner nvidia: 1.17.8-1

      • base do kit de ferramentas de contêiner nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (com ferramentas)

      • gerenciador de estrutura nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.31
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • NVIDIA SMI:

    • Versão do driver NVIDIA: 570.172.08

    • Versão CUDA: 12.8

  • Pacotes:

    • Linguagens e bibliotecas principais:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Para: 3.2.0-37.amzn2023

      • Ferrugem: 1.89.0-1.amzn2023.0.2

    • Bibliotecas principais:

      • GLiBC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Versão: 1.2.11-33.amzn2023.0.5

      • Utilitários XZ: 5.2.5-9.amzn2023.0.2

      • UTIL-Linux: 2.37.4-1.amzn2023.0.4

    • Neurônio:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • driver eva: 2.17.2-1.amzn2023

      • configuração efa: 1.18-1.amzn2023

      • Tempo de espera: 1.2.2-1.amzn2023

      • Perfil do efa: 1.7-1.amzn2023

    • núcleo:

      • kernel: 6.1.148-173.267.amzn2023

      • desenvolvimento do kernel: 6.1.148-173.267.amzn2023

      • cabeçalhos do kernel: 6.1.148-173.267.amzn2023

      • ferramentas do kernel: 6.1.148-173.267.amzn2023

      • módulos de kernel extras: 6.1.148-173.267.amzn2023

      • live patch do kernel: 1.0-0.amzn2023

    • Nvidia:

      • kit de ferramentas de contêiner nvidia: 1.17.8-1

      • base do kit de ferramentas de contêiner nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (com ferramentas)

      • gerenciador de estrutura nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.32
  • O Amazon Linux 2 agora está obsoleto. A AMI do Kubernetes é baseada em 023 AL2.

  • NVIDIA SMI:

    • Versão do driver NVIDIA: 570.172.08

    • Versão CUDA: 12.8

  • Pacotes:

    • Linguagens e bibliotecas principais:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.0.16+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Para: 3.2.0-37.amzn2023

      • Ferrugem: 1.89.0-1.amzn2023.0.2

    • Bibliotecas principais:

      • GLiBC: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Versão: 1.2.11-33.amzn2023.0.5

      • Utilitários XZ: 5.2.5-9.amzn2023.0.2

      • UTIL-Linux: 2.37.4-1.amzn2023.0.4

    • Neurônio:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2.25.145.0-1

    • EFA:

      • driver eva: 2.17.2-1.amzn2023

      • configuração efa: 1.18-1.amzn2023

      • Tempo de espera: 1.2.2-1.amzn2023

      • Perfil do efa: 1.7-1.amzn2023

    • núcleo:

      • kernel: 6.1.148-173.267.amzn2023

      • desenvolvimento do kernel: 6.1.148-173.267.amzn2023

      • cabeçalhos do kernel: 6.1.148-173.267.amzn2023

      • ferramentas do kernel: 6.1.148-173.267.amzn2023

      • módulos de kernel extras: 6.1.148-173.267.amzn2023

      • live patch do kernel: 1.0-0.amzn2023

    • Nvidia:

      • kit de ferramentas de contêiner nvidia: 1.17.8-1

      • base do kit de ferramentas de contêiner nvidia: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (com ferramentas)

      • gerenciador de estrutura nvidia: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.33

A tabela a seguir contém informações sobre os componentes desta versão da AMI e as versões correspondentes.

componente AL2023_x86 AL2023_arm64
EKS v1.3.4 v1.3.4
amazon-ssm-agent 3.3.2299.0-1.amzn2023 3.3.2299.0-1.amzn2023
aws-neuronx-dkms 2.23,9.0-dkms N/D
containerd 1.7.27-1.eks.amzn2023.0.4 1.7.27-1.eks.amzn2023.0.4
efa 2.17.2-1.amzn2023 2.17.2-1.amzn2023
ena 2,14,1 g 2,14,1 g
kernel 6.12.40-64.114.amzn2023 N/D
kernel 6.12 N/D 6.12.40-64.114.amzn2023
kmod-nvidia-latest-dkms 570.172.08-1.amzn2023 570.172.08-1.el9
nvidia-container-toolkit 1.17.8-1 1.17.8-1
runc 1.2.6-1.amzn2023.0.1 1.2.6-1.amzn2023.0.1

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 25 de agosto de 2025

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Esta versão inclui as seguintes alterações:

Kubernetes v1.28

NVIDIA SMI:

  • Versão do driver da NVIDIA: 570.172.08

  • Versão do CUDA: 12.8

Pacotes adicionados:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacotes atualizados:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Pacotes removidos:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repositório alterado:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.29

NVIDIA SMI:

  • Versão do driver da NVIDIA: 570.172.08

  • Versão do CUDA: 12.8

Pacotes adicionados:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacotes atualizados:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Pacotes removidos:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repositório alterado:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.30

NVIDIA SMI:

  • Versão do driver da NVIDIA: 570.172.08

  • Versão do CUDA: 12.8

Pacotes adicionados:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacotes atualizados:

  • aws-neuronx-dkms.noarch: 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64:1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64:2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64:57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

Pacotes removidos:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repositório alterado:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.31

NVIDIA SMI:

  • Versão do driver da NVIDIA: 570.172.08

  • Versão do CUDA: 12.8

Pacotes adicionados:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacotes atualizados:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Pacotes removidos:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repositório alterado:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.32

NVIDIA SMI:

  • Versão do driver da NVIDIA: 570.172.08

  • Versão do CUDA: 12.8

Pacotes adicionados:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Pacotes atualizados:

  • aws-neuronx-dkms.noarch: 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64:1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64:2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64:57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

Pacotes removidos:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Repositório alterado:

  • libnvidia-container-tools.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-rhel8-x86_64 → nvidia-container-toolkit

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 12 de agosto de 2025

A AMI inclui o seguinte:

  • AWS Serviço suportado: Amazon EC2

  • Sistema operacional: Amazon Linux 2023

  • Arquitetura de computação: ARM64

  • A versão mais recente disponível está instalada para os seguintes pacotes:

    • Kernel Linux: 6.12

    • FSx Lustro

    • Docker

    • AWS CLI v2 em /usr/bin/aws

    • NVIDIA DCGM

    • Nvidia Container Toolkit:

      • Comando de versão: nvidia-container-cli -V

    • Nvidia-docker2:

      • Comando de versão: nvidia-docker version

    • NVIDIA-IMEX: v570.172.08-1

  • Driver NVIDIA: 570.158.01

  • Pilha NVIDIA CUDA 12.4, 12,5, 12,6, 12,8:

    • Diretórios de instalação CUDA, NCCL e cuDDN: /usr/local/cuda-xx.x/

      • Exemplo: /usr/local/cuda-12.8/, /usr/local/cuda-12.8/

    • Versão compilada da NCCL:

      • Para o diretório CUDA de 12.4, compilou a versão NCCL 2.22.3+ .4 CUDA12

      • Para o diretório CUDA de 12.5, compilou a versão NCCL 2.22.3+ .5 CUDA12

      • Para o diretório CUDA de 12.6, compilou a versão NCCL 2.24.3+ .6 CUDA12

      • Para o diretório CUDA de 12.8, compilou a versão NCCL 2.27.5+ .8 CUDA12

    • CUDA padrão: 12,8

      • PATH /usr/local/cuda aponta para CUDA 12.8

      • Variáveis de ambiente atualizadas abaixo:

        • LD_LIBRARY_PATHter /usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64

        • PATHter /usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/

        • Para qualquer versão diferente do CUDA, atualize LD_LIBRARY_PATH adequadamente.

  • Instalador EFA: 1.42.0

  • Nvidia GDRCopy: 2.5.1

  • AWS O plugin OFI NCCL vem com o instalador EFA

    • Caminhos /opt/amazon/ofi-nccl/lib e /opt/amazon/ofi-nccl/efa são adicionados LD_LIBRARY_PATH a.

  • AWS CLI v2 em /usr/local/bin/aws

  • Tipo de volume do EBS: gp3

  • Python: /usr/bin/python3.9

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 6 de agosto de 2025

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui as seguintes atualizações:

K8s v1.28
  • Pacotes do Neuron:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plug-ins: 2.27.7.0-1

    • aws-neuronx-kProgramador 8:2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.29
  • Pacotes do Neuron:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plug-ins: 2.27.7.0-1

    • aws-neuronx-kProgramador 8:2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.30
  • Pacotes do Neuron:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plug-ins: 2.27.7.0-1

    • aws-neuronx-kProgramador 8:2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.31
  • Pacotes do Neuron:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plug-ins: 2.27.7.0-1

    • aws-neuronx-kProgramador 8:2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.32
  • Pacotes do Neuron:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8 plug-ins: 2.27.7.0-1

    • aws-neuronx-kProgramador 8:2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

Importante
  • AMI base do driver OSS NVIDIA para aprendizado profundo (Amazon Linux 2) versão 70.3

  • Deep Learning Base Proprietary NVIDIA Driver AMI (Amazon Linux 2) versão 68.4

  • Compatibilidade mais recente com o CUDA 12.8

  • Driver da NVIDIA atualizado de 570.158.01 para 570.172.08 para corrigir CVEs presentes no NVIDIA Security Bulletin de julho

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 31 de julho de 2025

A Amazon SageMaker HyperPod agora oferece suporte a uma nova AMI para clusters do Amazon EKS que atualiza o sistema operacional básico para o Amazon Linux 2023. Esta versão fornece várias melhorias do Amazon Linux 2 (AL2). HyperPod lançamentos novos AMIs regularmente, e recomendamos que você execute todos os seus HyperPod clusters nas versões mais recentes e seguras do AMIs para resolver vulnerabilidades e eliminar gradualmente softwares e bibliotecas desatualizados.

Principais atualizações

  • Sistema operacional: Amazon Linux 2023 (atualizado a partir do Amazon Linux 2 ou AL2)

  • Package Manager: o DNF é a ferramenta padrão de gerenciamento de pacotes, substituindo o YUM usado no AL2

  • Serviço de rede: systemd-networkd gerencia interfaces de rede, substituindo o ISC dhclient usado em AL2

  • Kernel Linux: versão 6.1, atualizada a partir do kernel usado em AL2

  • Glibc: Versão 2.34, atualizada a partir da versão em AL2

  • GCC: Versão 11.5.0, atualizada a partir da versão em AL2

  • NFS: Versão 1:2.6 .1, atualizada da versão 1:1.3 .4 em AL2

  • Driver da NVIDIA: versão 570.172.08, uma versão mais recente do driver

  • Python: Versão 3.9, substituindo o Python 2.7 usado em AL2

  • NVME: Versão 1.11.1, uma versão mais recente do driver NVMe

Antes da atualização

Há algumas questões importantes que você deve saber antes da atualização. Com o AL2 023, vários pacotes foram adicionados, atualizados ou removidos em comparação com o. AL2 É altamente recomendável que você teste seus aplicativos com o AL2 023 antes de atualizar seus clusters. Para obter uma lista abrangente de todas as alterações de pacotes em AL2 2023, consulte Alterações de pacotes no Amazon Linux 2023.

A seguir estão algumas das mudanças significativas entre AL2 e AL2 023:

  • Python 3.10: a atualização mais significativa, além do sistema operacional, é a da versão do Python. Após a atualização, os clusters têm o Python 3.10 como padrão. Embora algumas workloads de treinamento distribuído do Python 3.8 possam ser compatíveis com o Python 3.10, é altamente recomendável testar suas workloads específicas separadamente. Se a migração para o Python 3.10 for difícil, mas você ainda quiser atualizar o cluster para outros novos recursos, é possível instalar uma versão mais antiga do Python usando o comando yum install python-xx.x com scripts de ciclo de vida antes de executar qualquer workload. Teste os scripts de ciclo de vida existentes e o código da aplicação para verificar a compatibilidade.

  • Aplicação do tempo de execução da NVIDIA: AL2 023 aplica rigorosamente os requisitos de tempo de execução do contêiner da NVIDIA, fazendo com que contêineres com variáveis de ambiente NVIDIA codificadas (comoNVIDIA_VISIBLE_DEVICES: "all") falhem em nós somente da CPU (enquanto AL2 ignoram essas configurações quando nenhum driver de GPU está presente). Você pode substituir a imposição NVIDIA_VISIBLE_DEVICES: "void" configurando a especificação do seu pod ou usando imagens somente da CPU.

  • O cgroup v2: AL2 023 apresenta a próxima geração da hierarquia unificada de grupos de controle (cgroup v2). O cgroup v2 é usado para tempos de execução de contêineres e também é usado por. systemd Embora o AL2 023 ainda inclua código que pode fazer o sistema funcionar usando o cgroup v1, essa não é uma configuração recomendada.

  • Amazon VPC CNI e eksctl versões: AL2 023 também exige que sua versão CNI do Amazon VPC seja 1.16.2 ou superior e que sua versão seja 0.176.0 ou superior. eksctl

  • EFA on FSx for Lustre: agora você pode usar o EFA on FSx for Lustre, que permite alcançar um desempenho de aplicativo comparável ao de clusters locais AI/ML ou de HPC (computação de alto desempenho), enquanto se beneficia da escalabilidade, flexibilidade e elasticidade da computação em nuvem.

Além disso, a atualização para AL2 023 requer uma versão mínima do 1.0.643.0_1.0.192.0 Health Monitoring Agent. Conclua o seguinte procedimento para atualizar o Health Monitoring Agent:

  1. Se você usa scripts de HyperPod ciclo de vida do GitHub repositório awsome-distributed-training, certifique-se de obter a versão mais recente. As versões anteriores não são compatíveis com AL2 023. O novo script de ciclo de vida garante o containerd uso do armazenamento adicional montado para extrair imagens de contêineres em 023. AL2

  2. Obtenha a versão mais recente do repositório git da HyperPod CLI.

  3. Atualize as dependências com o seguinte comando: helm dependencies update helm_chart/HyperPodHelmChart.

  4. Conforme mencionado na etapa 4 do README de HyperPodHelmChart, execute o comando a seguir para atualizar a versão das dependências em execução no cluster: helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system

Workloads que foram testadas em clusters do EKS atualizados

Veja abaixo alguns casos de uso em que a atualização foi testada:

  • Compatibilidade com versões anteriores: trabalhos populares de treinamento distribuído que envolvem PyTorch devem ser compatíveis com versões anteriores na nova AMI. No entanto, como suas workloads podem depender de bibliotecas específicas do Python ou do Linux, recomendamos testar primeiro em uma escala menor ou em um subconjunto de nós antes de atualizar os clusters maiores.

  • Teste de acelerador: trabalhos em vários tipos de instância, utilizando aceleradores NVIDIA (para as famílias de instâncias P e G) e aceleradores AWS Neuron (para instâncias Trn) foram testados.

Como atualizar a AMI e as workloads correspondentes

É possível atualizar a AMI para a nova AMI usando um dos seguintes métodos:

  • Use a API create-cluster para criar um cluster com a AMI mais recente.

  • Use a update-cluster-softwareAPI para atualizar seu cluster existente. Observe que essa opção executa novamente qualquer script de ciclo de vida.

O cluster não estará disponível durante o processo de atualização. Recomendamos planejar esse tempo de inatividade e reiniciar a workload de treinamento a partir de um ponto de verificação existente após a conclusão da atualização. Como prática recomendada, sugerimos que você execute testes em um cluster menor antes de atualizar clusters maiores.

Se o comando de atualização falhar, primeiro identifique a causa da falha. Para falhas no script de ciclo de vida, faça as correções necessárias nos scripts e tente novamente. Com relação a quaisquer outros problemas que não possam ser resolvidos, entre em contato com o AWS Support.

Solução de problemas

Use a seção a seguir para ajudar a solucionar quaisquer problemas encontrados ao atualizar para o AL2 023.

Como faço para corrigir erros, como "nvml error: driver not loaded: unknown", em nós de cluster somente de CPU?

Se os contêineres que funcionavam nos nós da CPU do AL2 Amazon EKS agora falharem em AL2 023, sua imagem de contêiner pode ter variáveis de ambiente NVIDIA codificadas. Você pode verificar as variáveis de ambiente com codificação rígida usando o seguinte comando:

docker inspect image:tag | grep -i nvidia

AL2O 023 aplica rigorosamente esses requisitos, ao passo que AL2 foi mais tolerante com nós somente de CPU. Uma solução é substituir a imposição AL2 023 definindo determinadas variáveis de ambiente da NVIDIA em sua especificação de pod do Amazon EKS, conforme mostrado no exemplo a seguir:

yaml containers: - name: your-container image: your-image:tag env: - name: NVIDIA_VISIBLE_DEVICES value: "void" - name: NVIDIA_DRIVER_CAPABILITIES value: ""

Também é possível usar imagens de contêiner somente de CPU (como pytorch/pytorch:latest-cpu) ou criar imagens personalizadas sem dependências da NVIDIA.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 15 de julho de 2025

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui as seguintes atualizações:

K8s v1.28
  • Driver NVIDIA mais recente: 550.163.01

  • Padrão CUDA: 12.4

  • Instalador do EFA: 1.38.0

  • Pacotes do Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.29
  • Versão do driver da NVIDIA: 550.163.01

  • Versão do CUDA: 12.4

  • Instalador do EFA: 1.38.0

  • Pacotes do Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.30
  • Versão do driver da NVIDIA: 550.163.01

  • Versão do CUDA: 12.4

  • Versão do instalador do EFA: 1.38.0

  • Pacotes do Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.31
  • Versão do driver da NVIDIA: 550.163.01

  • Versão do CUDA: 12.4

  • Versão do instalador do EFA: 1.38.0

  • Pacotes do Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.32
  • Versão do driver da NVIDIA: 550.163.01

  • Versão do CUDA: 12.4

  • Versão do instalador do EFA: 1.38.0

  • Pacotes do Neuron:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64: 2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64: 2.26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0.16.2.0-1

    • aws-neuronx-gpsimd-tools.x86_64: 0.16.1.0_0a6506a47-1

    • aws-neuronx-k8-plugin.x86_64: 2.26.26.0-1

    • aws-neuronx-k8-scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64: 2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64: 2.24.54.0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 09 de junho de 2025

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.21.37.0 (a partir de 2.20.74.0)

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 22 de maio de 2025

Atualizações gerais de AMI

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Deep Learning Base AMI AL2
  • Driver NVIDIA mais recente: 550.163.01

  • Atualizações da pilha do CUDA:

    • CUDA padrão: 12.1

    • Versão da NCCL: 2.22.3

  • Instalador do EFA: 1.38.0

  • AWS OFI NCCL: 1.13.2

  • Kernel do Linux: 5.10

  • GDRCopy: 2,4

Importante
  • Atualização do NVIDIA Container Toolkit 1.17.4: a montagem de bibliotecas compatíveis com CUDA agora está desabilitada.

  • Atualizações do EFA de 1.37 para 1.38:

    • AWS O plugin OFI NCCL agora está localizado em/-nccl opt/amazon/ofi

    • A localização anterior /opt//aws-ofi-ncclestá obsoleta

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (a partir de 2.20.28.0)

  • aws-neuronx-collectives.x86_64:2.25.65.0_9858ac9a1-1 (de 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64:2.25.57.0_166c7a468-1 (de 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64:2.23.9.0 (a partir de 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (a partir de 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64:0.15.1.0_5d31b6a3f (de 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (a partir de 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (a partir de 2.24.23.0)

Observações sobre compatibilidade:

  • Os componentes da AMI, incluindo versões do CUDA, podem ser removidos ou alterados com base na política de suporte do framework.

  • Para oferecer compatibilidade, a versão do kernel é fixa. Os usuários devem evitar atualizações, a menos que sejam necessárias para patches de segurança.

  • Para EC2 instâncias com várias placas de rede, consulte o guia de configuração do EFA para obter a configuração adequada

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 07 de maio de 2025

Installed the latest version of AWS Neuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neurônio

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 28 de abril de 2025

Melhorias para o K8s

  • Atualização do driver da NVIDIA da versão 550.144.03 para a 550.163.01. Essa atualização visa abordar vulnerabilidades e exposições comuns (CVEs) presentes no Boletim de Segurança do NVIDIA GPU Display de abril de 2025.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Installed the latest version of AWS Neuron SDK
  • aws-neuronx-dkms.noarch: 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

  • aws-neuronx-tools.x86_64: 2.18.3.0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64:2.24.59.0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64:0.14.12.0-1

  • aws-neuronx-gpsimd-tools.x86_64: 0.14.6.0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64: 2.24.23.0-1

  • aws-neuronx-k8-scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64: 2.24.53.0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2.22.61.0-1

  • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 18 de abril de 2025

Atualizações gerais de AMI

  • Nova SageMaker HyperPod AMI para Amazon EKS 1.32.1.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

Deep Learning EKS AMI 1.32.1
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.32.1

    • Versão do Containerd: 1.7.27

    • Versão do Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.29

  • Amazon SSM Agent: 3.3.1611.0

  • Kernel do Linux: 5.10.235

  • Driver OSS da NVIDIA: 550.163.01

  • NVIDIA CUDA: 12.4

  • Instalador do EFA: 1.38.0

  • GDRCopy: 2.4.1-1

  • NVIDIA Container Toolkit: 1.17.6

  • AWS OFI NCCL: 1.13.2

  • aws-neuronx-tools: 2.18.3.0

  • aws-neuronx-runtime-lib: 2.24.53.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.20.28.0

  • aws-neuronx-collectives: 2.24.59.0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 18 de fevereiro de 2025

Melhorias para o K8s

  • Atualização do NVIDIA Container Toolkit da versão 1.17.3 para a versão 1.17.4.

  • Correção do problema em que os clientes não conseguiam se conectar aos nós após uma reinicialização.

  • Versão atualizada do Elastic Fabric Adapter (EFA) de 1.37.0 para 1.38.0.

  • O EFA agora inclui o plug-in AWS OFI NCCL, que está localizado no /opt/amazon/ofi-nccl diretório em vez do caminho original. /opt/aws-ofi-nccl/ Se você precisar atualizar sua variável de ambiente LD_LIBRARY_PATH, modifique o caminho para apontar para o novo local /opt/amazon/ofi-nccl local do plug-in OFI NCCL.

  • O pacote emacs foi removido deles. DLAMIs Você pode instalar emacs a partir do GNU Emacs.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64: 2.18.3.0-1 @neuron

  • aws-neuronx-collectives.x86_64:2.23.135.0_3e70920f2-1 neurônio

  • aws-neuronx-gpsimd-customop.x86_64: neurônio 0.2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64: neurônio 0.13.2.0_94ba34927-1

  • aws-neuronx-k8-plugin.x86_64:2.23.45.0-1 neurônio

  • aws-neuronx-k8-scheduler.x86_64:2.23.45.0-1 neurônio

  • aws-neuronx-runtime-lib.x86_64:2.23.112.0_9b5179492-1 neurônio

  • aws-neuronx-tools.x86_64: 2.20.204.0-1 neurônio

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 22 de janeiro de 2025

Atualizações gerais de AMI

  • Nova SageMaker HyperPod AMI para Amazon EKS 1.31.2.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

Deep Learning EKS AMI 1.31
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.31.2

    • Versão do Containerd: 1.7.23

    • Versão do Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Kernel do Linux: 5.10.230

  • Driver OSS da NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador do EFA: 1.37.0

  • GDRCopy: 2.4.1-1

  • NVIDIA Container Toolkit: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3

  • aws-neuronx-runtime-lib: 2.23.12.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.13.0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 21 de dezembro de 2024

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

K8s v1.28
  • Componentes do Amazon EKS

    • Kubernetes versão 1.28.15

    • Versão do Containerd: 1.7.23

    • Versão do Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Kernel do Linux: 5.10.228

  • Driver OSS da NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador do EFA: 1.37.0

  • GDRCopy: 2,4

  • NVIDIA Container Toolkit: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.12.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.29
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.29.10

    • Versão do Containerd: 1.7.23

    • Versão do Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Kernel do Linux: 5.15.0

  • Driver OSS da NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador do EFA: 1.37.0

  • GDRCopy: 2,4

  • NVIDIA Container Toolkit: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.12.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.30
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.30.6

    • Versão do Containerd: 1.7.23

    • Versão do Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Amazon SSM Agent: 3.3.987.0

  • Kernel do Linux: 5.10.228

  • Driver OSS da NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador do EFA: 1.37.0

  • GDRCopy: 2,4

  • NVIDIA Container Toolkit: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.12.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 13 de dezembro de 2024

SageMaker HyperPod Atualização do DLAMI para Amazon EKS

  • Atualização do SSM Agent para a versão 3.3.1311.0.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 24 de novembro de 2024

Atualizações gerais de AMI

  • Lançadas na região MEL (Melbourne).

  • DLAMI SageMaker HyperPod base atualizada para as seguintes versões:

    • Kubernetes: 2024-11-01.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 15 de novembro de 2024

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

Deep Learning EKS AMI 1.28
  • Componentes do Amazon EKS

    • Kubernetes versão 1.28.15

    • Versão do Containerd: 1.7.23

    • Versão do Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Kernel do Linux: 5.10.228

  • Driver OSS da NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador do EFA: 1.34.0

  • GDRCopy: 2,4

  • NVIDIA Container Toolkit: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.3.0

Deep Learning EKS AMI 1.29
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.29.10

    • Versão do Containerd: 1.7.23

    • Versão do Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Kernel do Linux: 5.10.228

  • Driver OSS da NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador do EFA: 1.34.0

  • GDRCopy: 2,4

  • NVIDIA Container Toolkit: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.3.0

Deep Learning EKS AMI 1.30
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.30.6

    • Versão do Containerd: 1.7.23

    • Versão do Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Kernel do Linux: 5.10.228

  • Driver OSS da NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador do EFA: 1.34.0

  • GDRCopy: 2,4

  • NVIDIA Container Toolkit: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.3.0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 11 de novembro de 2024

Atualizações gerais de AMI

  • SageMaker HyperPod DLAMI atualizado com as versões 1.28.13, 1.29.8, 1.30.4 do Amazon EKS.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 21 de outubro de 2024

Atualizações gerais de AMI

  • DLAMI SageMaker HyperPod base atualizada para as seguintes versões:

    • Amazon EKS: 1.28.11, 1.29.6 e 1.30.2.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 10 de setembro de 2024

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

Deep Learning EKS AMI 1.28
  • Componentes do Amazon EKS

    • Kubernetes versão 1.28.11

    • Versão do Containerd: 1.7.20

    • Versão Runc: 1.1.11

    • AWS Autenticador IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux Kernel: 5.10.223

  • Driver NVIDIA OSS: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador EFA: 1.32.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner NVIDIA: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.29
  • Componentes do Amazon EKS

    • Kubernetes versão: 1.29.6

    • Versão do Containerd: 1.7.20

    • Versão Runc: 1.1.11

    • AWS Autenticador IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux Kernel: 5.10.223

  • Driver Nvidia OSS: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador EFA: 1.32.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner Nvidia: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.30
  • Componentes do Amazon EKS

    • Kubernetes versão: 1.30.2

    • Versão do Containerd: 1.7.20

    • Versão Runc: 1.1.11

    • AWS Autenticador IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux Kernel: 5.10.223

  • Driver Nvidia OSS: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador EFA: 1.32.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner Nvidia: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0