SageMaker HyperPod Lanzamientos de AMI para Amazon EKS - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS

Las siguientes notas de la versión incluyen las últimas actualizaciones de las versiones de Amazon SageMaker HyperPod AMI para Amazon EKS Orchestration. Cada nota de la versión incluye una lista resumida de los paquetes preinstalados o preconfigurados para el soporte de SageMaker HyperPod DLAMIs Amazon EKS. Cada DLAMI se basa en Amazon Linux 2 AL2 () y es compatible con una versión específica de Kubernetes. Para ver las versiones HyperPod de DLAMI para la orquestación de Slurm, consulte. SageMaker HyperPod Lanzamientos de AMI para Slurm Para obtener información sobre las versiones de SageMaker HyperPod funciones de Amazon, consulteNotas de SageMaker HyperPod lanzamiento de Amazon.

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 22 de mayo de 2025

Actualizaciones generales de la AMI

SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS

Deep Learning Base AMI AL2
  • Controlador NVIDIA más reciente: 550.163.01

  • Actualizaciones de CUDA Stack:

    • CUDA predeterminado: 12.1

    • Versión NCCL: 2.22.3

  • Instalador de EFA: 1.38.0

  • AWS PARA NCCL: 1.13.2

  • Núcleo de Linux: 5.10

  • GDRCopy: 2.4

importante
  • Actualización 1.17.4 de NVIDIA Container Toolkit: el montaje de las bibliotecas compatibles con CUDA ahora está deshabilitado

  • Actualizaciones de EFA de la versión 1.37 a la 1.38:

    • AWS El complemento OFI NCCL ahora se encuentra en/-nccl opt/amazon/ofi

    • La ubicación anterior /opt//está obsoleta aws-ofi-nccl

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (desde el 2.20.28.0)

  • aws-neuronx-collectives.x86_64:2.25.65.0_9858ac9a1-1 (desde el 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64: 2.25.57.0_166c7a468-1 (desde el 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64: 2.23.9.0 (desde 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (desde el 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64:0.15.1.0_5d31b6a3f (desde el 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (desde el 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (desde el 2.24.23.0)

Notas de soporte:

  • Los componentes de la AMI, incluidas las versiones CUDA, se pueden eliminar o cambiar según la política de soporte del marco.

  • La versión del núcleo está fijada por motivos de compatibilidad. Los usuarios deben evitar las actualizaciones a menos que sean necesarias para los parches de seguridad

  • EC2 En el caso de instancias con varias tarjetas de red, consulte la guía de configuración de EFA para obtener una configuración adecuada

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 7 de mayo de 2025

Installed the latest version of AWS Neuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neurona

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 28 de abril de 2025

Mejoras para los K8

  • Se actualizó el controlador NVIDIA de la versión 550.144.03 a la 550.163.01. Esta actualización tiene como objetivo abordar las vulnerabilidades y exposiciones comunes (CVEs) presentes en el boletín de seguridad de las pantallas de las GPU de NVIDIA de abril de 2025.

SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS

Installed the latest version of AWS Neuron SDK
  • aws-neuronx-dkms.narch: 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

  • aws-neuronx-tools.x86_64:2.18.3.0-1

  • aws-neuron-dkms.march: 2.3.26.0-dms

  • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64:1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

  • aws-neuron-tools.x86_64:2.1.4,0-1

  • aws-neuronx-collectives.x86_64:2.24.59.0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.14.12.0-1

  • aws-neuronx-gpsimd-tools.x86_64:0.14.6.0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64:2.24.23.0-1

  • aws-neuronx-k8-scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64:2.24.53.0_f239092cc-1

  • aws-neuronx-tools.x86_64:2.22.61.0-1

  • tensorflow-model-server-neuronx.x86_64:2.10.1.2.12.2.0-0

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 18 de abril de 2025

Actualizaciones generales de la AMI

  • Nueva SageMaker HyperPod AMI para Amazon EKS 1.32.1.

SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS

AMIs Entre ellas se incluyen las siguientes:

Deep Learning EKS AMI 1.32.1
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.32.1

    • Versión contenedora: 1.7.27

    • Versión Runc: 1.1.14

    • AWS Autenticador de IAM: 0.6.29

  • Agente de Amazon SSM: 3.3.1611.0

  • Núcleo de Linux: 5.10.235

  • Controlador OSS Nvidia: 550.163.01

  • NVIDIA CUDA: 12.4

  • Instalador EFA: 1.38.0

  • GDRCopy: 2.4.1-1

  • Kit de herramientas de contenedores Nvidia: 1.17.6

  • AWS PARA NCCL: 1.13.2

  • aws-neuronx-tools: 2.18.3.0

  • aws-neuronx-runtime-lib: 2.24.53.0

  • aws-neuronx-oci-hook: 2.4.4,0-1

  • aws-neuronx-dkms: 2.20.28.0

  • aws-neuronx-collectives: 2.24.59.0

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 18 de febrero de 2025

Mejoras para los K8

  • Se actualizó el kit de herramientas de contenedores de Nvidia de la versión 1.17.3 a la versión 1.17.4.

  • Se solucionó el problema por el que los clientes no podían conectarse a los nodos después de un reinicio.

  • Versión mejorada del Elastic Fabric Adapter (EFA) de 1.37.0 a 1.38.0.

  • La EFA ahora incluye el complemento AWS OFI NCCL, que se encuentra en el directorio en lugar de en la ruta original. /opt/amazon/ofi-nccl /opt/aws-ofi-nccl/ Si necesita actualizar la variable de LD_LIBRARY_PATH entorno, asegúrese de modificar la ruta para que apunte a la nueva /opt/amazon/ofi-nccl ubicación del complemento OFI NCCL.

  • Eliminó el paquete emacs de estos. DLAMIs Puede instalar emacs desde GNU emac.

SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64: 2.18.3.0-1 @neuron

  • aws-neuronx-collectives.x86_64: 2.23.135.0_3e70920f2-1 neurona

  • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1 neurona

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64:0.13.2.0_94ba34927-1 neurona

  • aws-neuronx-k8-plugin.x86_64: 2.23.45.0-1 neurona

  • aws-neuronx-k8-scheduler.x86_64: 2.23.45.0-1 neurona

  • aws-neuronx-runtime-lib.x86_64:2.23.112.0_9b5179492-1 neurona

  • aws-neuronx-tools.x86_64:2.20.204.0-1 neurona

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 22 de enero de 2025

Actualizaciones generales de la AMI

  • Nueva SageMaker HyperPod AMI para Amazon EKS 1.31.2.

SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS

AMIs Entre ellas se incluyen las siguientes:

Deep Learning EKS AMI 1.31
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.31.2

    • Versión contenedora: 1.7.23

    • Versión Runc: 1.1.14

    • AWS Autenticador de IAM: 0.6.26

  • Agente de Amazon SSM: 3.3.987

  • Núcleo de Linux: 5.10.230

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador EFA: 1.37.0

  • GDRCopy: 2.4.1-1

  • Kit de herramientas de contenedores Nvidia: 1.17.3

  • AWS PARA NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4,0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.1330

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 21 de diciembre de 2024

SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS

AMIs Entre ellas se incluyen las siguientes:

K8s v1.28
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.28.15

    • Versión contenedora: 1.7.23

    • Versión Runc: 1.1.14

    • AWS Autenticador de IAM: 0.6.26

  • Agente de Amazon SSM: 3.3.987

  • Núcleo de Linux: 5.10.228

  • Controlador OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador EFA: 1.37.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedores de NVIDIA: 1.17.3

  • AWS PARA NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4,0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.29
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.29.10

    • Versión contenedora: 1.7.23

    • Versión Runc: 1.1.14

    • AWS Autenticador de IAM: 0.6.26

  • Agente de Amazon SSM: 3.3.987

  • Núcleo de Linux: 5.15.0

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador EFA: 1.37.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedores Nvidia: 1.17.3

  • AWS PARA NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4,0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.30
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.30.6

    • Versión contenedora: 1.7.23

    • Versión Runc: 1.1.14

    • AWS Autenticador de IAM: 0.6.26

  • Agente de Amazon SSM: 3.3.987.0

  • Núcleo de Linux: 5.10.228

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador EFA: 1.37.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedores Nvidia: 1.17.3

  • AWS PARA NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4,0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 13 de diciembre de 2024

SageMaker HyperPod Actualización de DLAMI para Amazon EKS

  • Se actualizó el agente SSM a la versión. 3.3.1311.0

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 24 de noviembre de 2024

Actualizaciones generales de la AMI

  • Publicado en la región MEL (Melbourne).

  • Se actualizó el DLAMI SageMaker HyperPod base a las siguientes versiones:

    • Kubernetes: 01/11/2020.

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 15 de noviembre de 2024

SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS

AMIs Entre ellas se incluyen las siguientes:

Deep Learning EKS AMI 1.28
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.28.15

    • Versión contenedora: 1.7.23

    • Versión Runc: 1.1.14

    • AWS Autenticador de IAM: 0.6.26

  • Agente de Amazon SSM: 3.3.987

  • Núcleo de Linux: 5.10.228

  • Controlador OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador EFA: 1.34.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedores de NVIDIA: 1.17.3

  • AWS PARA NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4,0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.29
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.29.10

    • Versión contenedora: 1.7.23

    • Versión Runc: 1.1.14

    • AWS Autenticador de IAM: 0.6.26

  • Agente de Amazon SSM: 3.3.987

  • Núcleo de Linux: 5.10.228

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador EFA: 1.34.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedores Nvidia: 1.17.3

  • AWS PARA NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4,0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.30
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.30.6

    • Versión contenedora: 1.7.23

    • Versión Runc: 1.1.14

    • AWS Autenticador de IAM: 0.6.26

  • Agente de Amazon SSM: 3.3.987

  • Núcleo de Linux: 5.10.228

  • Controlador OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Instalador EFA: 1.34.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedores Nvidia: 1.17.3

  • AWS PARA NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4,0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 11 de noviembre de 2024

Actualizaciones generales de la AMI

  • SageMaker HyperPod DLAMI actualizado con las versiones 1.28.13, 1.29.8 y 1.30.4 de Amazon EKS.

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 21 de octubre de 2024

Actualizaciones generales de la AMI

  • Se actualizó el DLAMI SageMaker HyperPod base a las siguientes versiones:

    • Amazon EKS: 1.28.11, 1.29.6, 1.30.2.

SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 10 de septiembre de 2024

SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS

AMIs Entre ellas se incluyen las siguientes:

Deep Learning EKS AMI 1.28
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.28.11

    • Versión de Containerd: 1.7.20

    • Versión de Runc: 1.1.11

    • AWS Autenticador de IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Kernel de Linux: 5.10.223

  • Controlador con software de código abierto de NVIDIA: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador de EFA: 1.32.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedor de NVIDIA: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.29
  • Componentes de Amazon EKS

    • Versión de Kubernetes: 1.29.6

    • Versión de Containerd: 1.7.20

    • Versión de Runc: 1.1.11

    • AWS Autenticador de IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Kernel de Linux: 5.10.223

  • Controlador con software de código abierto de NVIDIA: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador de EFA: 1.32.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedor de NVIDIA: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.30
  • Componentes de Amazon EKS

    • Versión de Kubernetes 1.30.2

    • Versión de Containerd: 1.7.20

    • Versión de Runc: 1.1.11

    • AWS Autenticador de IAM: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Kernel de Linux: 5.10.223

  • Controlador con software de código abierto de NVIDIA: 535.183.01

  • NVIDIA CUDA: 12.2

  • Instalador de EFA: 1.32.0

  • GDRCopy: 2.4

  • Kit de herramientas de contenedor de NVIDIA: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0