SageMaker HyperPod Lançamentos da AMI para o Amazon EKS - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS

As notas de lançamento a seguir acompanham as atualizações mais recentes dos lançamentos do Amazon SageMaker HyperPod AMI para orquestração do Amazon EKS. Cada nota de lançamento inclui uma lista resumida de pacotes pré-instalados ou pré-configurados no suporte do SageMaker HyperPod DLAMIs Amazon EKS. Cada DLAMI é construído no Amazon Linux 2 AL2 () e oferece suporte a uma versão específica do Kubernetes. Para versões HyperPod do DLAMI para orquestração do Slurm, consulte. SageMaker HyperPod Lançamentos da AMI para o Slurm Para obter informações sobre os lançamentos de SageMaker HyperPod recursos da Amazon, consulteNotas SageMaker HyperPod de lançamento da Amazon.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 09 de junho de 2025

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.21.37.0 (a partir de 2.20.74.0)

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 22 de maio de 2025

Atualizações gerais da AMI

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Deep Learning Base AMI AL2
  • Driver NVIDIA mais recente: 550.163.01

  • Atualizações do CUDA Stack:

    • CUDA padrão: 12.1

    • Versão NCCL: 2.22.3

  • Instalador EFA: 1.38.0

  • AWS OFI NCCL: 1.13.2

  • Kernel Linux: 5.10

  • GDRCopy: 2,4

Importante
  • Atualização do NVIDIA Container Toolkit 1.17.4: a montagem de bibliotecas compatíveis com CUDA agora está desativada

  • Atualizações do EFA de 1.37 para 1.38:

    • AWS O plugin OFI NCCL agora está localizado em/-nccl opt/amazon/ofi

    • A localização anterior /opt//aws-ofi-ncclestá obsoleta

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (a partir de 2.20.28.0)

  • aws-neuronx-collectives.x86_64:2.25.65.0_9858ac9a1-1 (de 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64:2.25.57.0_166c7a468-1 (de 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64:2.23.9.0 (a partir de 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (a partir de 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64:0.15.1.0_5d31b6a3f (de 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (a partir de 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (a partir de 2.24.23.0)

Support notes:

  • Os componentes da AMI, incluindo versões CUDA, podem ser removidos ou alterados com base na política de suporte da estrutura

  • A versão do kernel está fixada para fins de compatibilidade. Os usuários devem evitar atualizações, a menos que sejam necessárias para patches de segurança

  • Para EC2 instâncias com várias placas de rede, consulte o guia de configuração do EFA para obter a configuração adequada

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 07 de maio de 2025

Installed the latest version of AWS Neuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neurônio

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 28 de abril de 2025

Melhorias para K8s

  • Driver NVIDIA atualizado da versão 550.144.03 para 550.163.01. Essa atualização visa abordar vulnerabilidades e exposições comuns (CVEs) presentes no Boletim de Segurança do NVIDIA GPU Display de abril de 2025.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Installed the latest version of AWS Neuron SDK
  • aws-neuronx-dkms.noarch: 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

  • aws-neuronx-tools.x86_64: 2.18.3.0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64:2.24.59.0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64:0.14.12.0-1

  • aws-neuronx-gpsimd-tools.x86_64: 0.14.6.0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64: 2.24.23.0-1

  • aws-neuronx-k8-scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64: 2.24.53.0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2.22.61.0-1

  • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 18 de abril de 2025

Atualizações gerais da AMI

  • Nova SageMaker HyperPod AMI para Amazon EKS 1.32.1.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

Deep Learning EKS AMI 1.32.1
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.32.1

    • Versão do contêiner: 1.7.27

    • Versão Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.29

  • Agente Amazon SSM: 3.3.1611.0

  • Kernel Linux: 5.10.235

  • Controlador OSS Nvidia: 550.163.01

  • NVIDIA CUDA: 12,4

  • Instalador EFA: 1.38.0

  • GDRCopy: 2.4.1-1

  • Kit de ferramentas de contêiner Nvidia: 1.17.6

  • AWS OFI NCCL: 1.13.2

  • aws-neuronx-tools: 2.18.3.0

  • aws-neuronx-runtime-lib: 2.24.53.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.20.28.0

  • aws-neuronx-collectives: 2.24.59.0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 18 de fevereiro de 2025

Melhorias para K8s

  • Kit de ferramentas de contêiner Nvidia atualizado da versão 1.17.3 para a versão 1.17.4.

  • Corrigido o problema em que os clientes não conseguiam se conectar aos nós após uma reinicialização.

  • Versão atualizada do Elastic Fabric Adapter (EFA) de 1.37.0 para 1.38.0.

  • O EFA agora inclui o plug-in AWS OFI NCCL, que está localizado no /opt/amazon/ofi-nccl diretório em vez do caminho original. /opt/aws-ofi-nccl/ Se você precisar atualizar sua variável de LD_LIBRARY_PATH ambiente, certifique-se de modificar o caminho para apontar para o novo /opt/amazon/ofi-nccl local do plug-in OFI NCCL.

  • O pacote emacs foi removido deles. DLAMIs Você pode instalar o emacs a partir do GNU emac.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64: 2.18.3.0-1 @neuron

  • aws-neuronx-collectives.x86_64:2.23.135.0_3e70920f2-1 neurônio

  • aws-neuronx-gpsimd-customop.x86_64: neurônio 0.2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64: neurônio 0.13.2.0_94ba34927-1

  • aws-neuronx-k8-plugin.x86_64:2.23.45.0-1 neurônio

  • aws-neuronx-k8-scheduler.x86_64:2.23.45.0-1 neurônio

  • aws-neuronx-runtime-lib.x86_64:2.23.112.0_9b5179492-1 neurônio

  • aws-neuronx-tools.x86_64: 2.20.204.0-1 neurônio

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 22 de janeiro de 2025

Atualizações gerais da AMI

  • Nova SageMaker HyperPod AMI para Amazon EKS 1.31.2.

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

Deep Learning EKS AMI 1.31
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.31.2

    • Versão do contêiner: 1.7.23

    • Versão Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.230

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12,4

  • Instalador EFA: 1.37.0

  • GDRCopy: 2.4.1-1

  • Kit de ferramentas de contêiner Nvidia: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3

  • aws-neuronx-runtime-lib: 2.23.12.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.13.0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 21 de dezembro de 2024

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

K8s v1.28
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.28.15

    • Versão do contêiner: 1.7.23

    • Versão Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12,4

  • Instalador EFA: 1.37.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner NVIDIA: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.12.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.29
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.29.10

    • Versão do contêiner: 1.7.23

    • Versão Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.15.0

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12,4

  • Instalador EFA: 1.37.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner Nvidia: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.12.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.30
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.30.6

    • Versão do contêiner: 1.7.23

    • Versão Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987.0

  • Kernel Linux: 5.10.228

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12,4

  • Instalador EFA: 1.37.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner Nvidia: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.12.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 13 de dezembro de 2024

SageMaker HyperPod Atualização do DLAMI para Amazon EKS

  • Agente SSM atualizado para a versão3.3.1311.0.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 24 de novembro de 2024

Atualizações gerais da AMI

  • Lançado na região MEL (Melbourne).

  • DLAMI SageMaker HyperPod base atualizada para as seguintes versões:

    • Kubernetes: 2024-11-01.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 15 de novembro de 2024

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

Deep Learning EKS AMI 1.28
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.28.15

    • Versão do contêiner: 1.7.23

    • Versão Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12,4

  • Instalador EFA: 1.34.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner NVIDIA: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.3.0

Deep Learning EKS AMI 1.29
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.29.10

    • Versão do contêiner: 1.7.23

    • Versão Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12,4

  • Instalador EFA: 1.34.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner Nvidia: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.3.0

Deep Learning EKS AMI 1.30
  • Componentes do Amazon EKS

    • Versão do Kubernetes: 1.30.6

    • Versão do contêiner: 1.7.23

    • Versão Runc: 1.1.14

    • AWS Autenticador IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12,4

  • Instalador EFA: 1.34.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner Nvidia: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.3.0

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 11 de novembro de 2024

Atualizações gerais da AMI

  • SageMaker HyperPod DLAMI atualizado com as versões 1.28.13, 1.29.8, 1.30.4 do Amazon EKS.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 21 de outubro de 2024

Atualizações gerais da AMI

  • DLAMI SageMaker HyperPod base atualizada para as seguintes versões:

    • Amazon EKS: 1.28.11, 1.29.6, 1.30.2.

SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 10 de setembro de 2024

SageMaker HyperPod Suporte ao DLAMI para Amazon EKS

AMIs Isso inclui o seguinte:

Deep Learning EKS AMI 1.28
  • Componentes do Amazon EKS

    • Kubernetes versão 1.28.11

    • Versão do Containerd: 1.7.20

    • Versão Runc: 1.1.11

    • AWS Autenticador IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux Kernel: 5.10.223

  • Driver NVIDIA OSS: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador EFA: 1.32.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner NVIDIA: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.29
  • Componentes do Amazon EKS

    • Kubernetes versão: 1.29.6

    • Versão do Containerd: 1.7.20

    • Versão Runc: 1.1.11

    • AWS Autenticador IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux Kernel: 5.10.223

  • Driver Nvidia OSS: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador EFA: 1.32.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner Nvidia: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.30
  • Componentes do Amazon EKS

    • Kubernetes versão: 1.30.2

    • Versão do Containerd: 1.7.20

    • Versão Runc: 1.1.11

    • AWS Autenticador IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux Kernel: 5.10.223

  • Driver Nvidia OSS: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador EFA: 1.32.0

  • GDRCopy: 2,4

  • Kit de ferramentas de contêiner Nvidia: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0