SageMaker HyperPod Versioni AMI per Amazon EKS - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker HyperPod Versioni AMI per Amazon EKS

Le seguenti note di rilascio tengono traccia degli ultimi aggiornamenti per le versioni di Amazon SageMaker HyperPod AMI per l'orchestrazione di Amazon EKS. Ogni nota di versione include un elenco riepilogativo dei pacchetti preinstallati o preconfigurati nel supporto per SageMaker HyperPod DLAMIs Amazon EKS. Ogni DLAMI è basato su Amazon Linux 2 (AL2) e supporta una versione specifica di Kubernetes. Per le versioni HyperPod DLAMI per l'orchestrazione di Slurm, vedere. SageMaker HyperPod Versioni AMI per Slurm Per informazioni sulle versioni delle SageMaker HyperPod funzionalità di Amazon, consultaNote di SageMaker HyperPod rilascio di Amazon.

SageMaker HyperPod Versioni AMI per Amazon EKS: 22 maggio 2025

Aggiornamenti generali AMI

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Deep Learning Base AMI AL2
  • Driver NVIDIA più recente: 550.163.01

  • Aggiornamenti CUDA Stack:

    • CUDA predefinito: 12.1

    • Versione NCCL: 2.22.3

  • Programma di installazione EFA: 1.38.0

  • AWS OFI NCCL: 1.13.2

  • Kernel Linux: 5.10

  • GDRCopy: 2.4

Importante
  • Aggiornamento NVIDIA Container Toolkit 1.17.4: il montaggio delle librerie compatte CUDA è ora disabilitato

  • Aggiornamenti EFA dalla versione 1.37 alla 1.38:

    • AWS Il plugin OFI NCCL ora si trova in/-nccl opt/amazon/ofi

    • La posizione precedente /opt//è obsoleta aws-ofi-nccl

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (dal 2.20.28.0)

  • aws-neuronx-collectives.x86_64:2.25.65.0_9858ac9a1-1 (da 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64:2.25.57.0_166c7a468-1 (da 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64: 2.23.9.0 (da 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (dalla 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64:0.15.1.0_5d31b6a3f (da 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (dal 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (dal 2.24.23.0)

Note di supporto:

  • I componenti AMI, incluse le versioni CUDA, possono essere rimossi o modificati in base alla politica di supporto del framework

  • La versione del kernel è impostata per motivi di compatibilità. Gli utenti devono evitare gli aggiornamenti a meno che non siano necessari per le patch di sicurezza

  • Per i EC2 casi con più schede di rete, consulta la guida alla configurazione EFA per una corretta configurazione

SageMaker HyperPod Versioni AMI per Amazon EKS: 7 maggio 2025

Installed the latest version of AWS Neuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neurone

SageMaker HyperPod Versioni AMI per Amazon EKS: 28 aprile 2025

Miglioramenti per K8s

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Installed the latest version of AWS Neuron SDK
  • aws-neuronx-dkms.noarch: 2,20.28,0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4,0-1

  • aws-neuronx-tools.x86_64: 2,18.3,0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8 plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1,6,21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64:2,24.59,0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64:0,2,3,0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0,14-12,0-1

  • aws-neuronx-gpsimd-tools.x86_64:0,14.6,0_241eb69f4-1

  • aws-neuronx-k8 plugin.x86_64:2.24.23.0-1

  • aws-neuronx-k8-scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64:2,24.53,0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2.22.61.0-1

  • tensorflow-model-server-neuronx.x86_64: 2,10,1,2,2,0-0

SageMaker HyperPod Versioni AMI per Amazon EKS: 18 aprile 2025

Aggiornamenti generali AMI

  • Nuova SageMaker HyperPod AMI per Amazon EKS 1.32.1.

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

Deep Learning EKS AMI 1.32.1
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.32.1

    • Versione Containers: 1.7.27

    • Versione Runc: 1.1.14

    • AWS Autenticatore IAM: 0.6.29

  • Agente Amazon SSM: 3.3.1611.0

  • Kernel Linux: 5.10.235

  • Driver del sistema operativo Nvidia: 550.163.01

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.38.0

  • GDRCopy: 2.4.1-1

  • Toolkit per contenitori Nvidia: 1.17.6

  • AWS OFI NCCL: 1.13.2

  • aws-neuronx-tools: 2.18.3,0

  • aws-neuronx-runtime-lib: 2,24,53,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,20,28,0

  • aws-neuronx-collectives: 2,2459,0

SageMaker HyperPod Versioni AMI per Amazon EKS: 18 febbraio 2025

Miglioramenti per K8s

  • Toolkit per container Nvidia aggiornato dalla versione 1.17.3 alla versione 1.17.4.

  • È stato risolto il problema per cui i clienti non erano in grado di connettersi ai nodi dopo il riavvio.

  • Versione Elastic Fabric Adapter (EFA) aggiornata da 1.37.0 a 1.38.0.

  • L'EFA ora include il plugin AWS OFI NCCL, che si trova nella directory anziché nel percorso originale. /opt/amazon/ofi-nccl /opt/aws-ofi-nccl/ Se devi aggiornare la variabile di LD_LIBRARY_PATH ambiente, assicurati di modificare il percorso in modo che punti alla nuova /opt/amazon/ofi-nccl posizione del plugin OFI NCCL.

  • Ho rimosso il pacchetto emacs da questi. DLAMIs È possibile installare emacs da GNU emac.

SageMaker HyperPod Supporto DLAMI per Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64,0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4,0-1 @neuron

  • aws-neuronx-tools.x86_64: 2,18,0-1 @neuron

  • aws-neuronx-collectives.x86_64:2.23.135.0_3e70920f2-1 neurone

  • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1 neurone

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64:0.13.2.0_94ba34927-1 neurone

  • aws-neuronx-k8-plugin.x86_64:2.23.45.0-1 neurone

  • aws-neuronx-k8-scheduler.x86_64: 2.23.45.0-1 neurone

  • aws-neuronx-runtime-lib.x86_64:2.23.112.0_9b5179492-1 neurone

  • aws-neuronx-tools.x86_64: 2.20.204.0-1 neurone

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod Versioni AMI per Amazon EKS: 22 gennaio 2025

Aggiornamenti generali AMI

  • Nuova SageMaker HyperPod AMI per Amazon EKS 1.31.2.

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

Deep Learning EKS AMI 1.31
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.31.2

    • Versione Containers: 1.7.23

    • Versione Runc: 1.1.14

    • AWS Autenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.230

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.37.0

  • GDRCopy: 2.4.1-1

  • Toolkit per contenitori Nvidia: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2,23.133,0

SageMaker HyperPod Versioni AMI per Amazon EKS: 21 dicembre 2024

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

K8s v1.28
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.28.15

    • Versione Containers: 1.7.23

    • Versione Runc: 1.1.14

    • AWS Autenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.37.0

  • GDRCopy: 2.4

  • Toolkit per contenitori NVIDIA: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.29
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.29.10

    • Versione Containers: 1.7.23

    • Versione Runc: 1.1.14

    • AWS Autenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.15.0

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.37.0

  • GDRCopy: 2.4

  • Toolkit per contenitori Nvidia: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.30
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.30.6

    • Versione Containers: 1.7.23

    • Versione Runc: 1.1.14

    • AWS Autenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987.0

  • Kernel Linux: 5.10.228

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.37.0

  • GDRCopy: 2.4

  • Toolkit per contenitori Nvidia: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2,23,135,0

SageMaker HyperPod Versioni AMI per Amazon EKS: 13 dicembre 2024

SageMaker HyperPod Aggiornamento DLAMI per Amazon EKS

  • Agente SSM aggiornato alla versione. 3.3.1311.0

SageMaker HyperPod Versioni AMI per Amazon EKS: 24 novembre 2024

Aggiornamenti generali AMI

  • Rilasciato nella regione MEL (Melbourne).

  • DLAMI di SageMaker HyperPod base aggiornato alle seguenti versioni:

    • Kubernetes: 2024-11-01.

SageMaker HyperPod Versioni AMI per Amazon EKS: 15 novembre 2024

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

Deep Learning EKS AMI 1.28
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.28.15

    • Versione Containers: 1.7.23

    • Versione Runc: 1.1.14

    • AWS Autenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.34.0

  • GDRCopy: 2.4

  • Toolkit per contenitori NVIDIA: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,2,19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.29
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.29.10

    • Versione Containers: 1.7.23

    • Versione Runc: 1.1.14

    • AWS Autenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.34.0

  • GDRCopy: 2.4

  • Toolkit per contenitori Nvidia: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,2,19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.30
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.30.6

    • Versione Containers: 1.7.23

    • Versione Runc: 1.1.14

    • AWS Autenticatore IAM: 0.6.26

  • Agente Amazon SSM: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Programma di installazione EFA: 1.34.0

  • GDRCopy: 2.4

  • Toolkit per contenitori Nvidia: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,2,19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18.20,0

  • aws-neuronx-collectives: 2.22.33.0

SageMaker HyperPod Versioni AMI per Amazon EKS: 11 novembre 2024

Aggiornamenti generali AMI

  • SageMaker HyperPod DLAMI aggiornato con le versioni di Amazon EKS 1.28.13, 1.29.8, 1.30.4.

SageMaker HyperPod Versioni AMI per Amazon EKS: 21 ottobre 2024

Aggiornamenti generali AMI

  • DLAMI di SageMaker HyperPod base aggiornato alle seguenti versioni:

    • Amazon EKS: 1.28.11, 1.29.6, 1.30.2.

SageMaker HyperPod Versioni AMI per Amazon EKS: 10 settembre 2024

SageMaker HyperPod Supporto DLAMI per Amazon EKS

AMIs Includono quanto segue:

Deep Learning EKS AMI 1.28
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.28.11

    • Versione Containers: 1.7.20

    • Versione Runc: 1.1.11

    • AWS Autenticatore IAM: 0.6.21

  • Agente Amazon SSM: 3.3.380

  • Kernel Linux: 5.10.223

  • Driver OSS NVIDIA: 535.183.01

  • NVIDIA CUDA: 12.2

  • Programma di installazione EFA: 1.32.0

  • GDRCopy: 2.4

  • Toolkit per contenitori NVIDIA: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 217.17,0

  • aws-neuronx-collectives: 2,21,46,0

Deep Learning EKS AMI 1.29
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.29.6

    • Versione Containers: 1.7.20

    • Versione Runc: 1.1.11

    • AWS Autenticatore IAM: 0.6.21

  • Agente Amazon SSM: 3.3.380

  • Kernel Linux: 5.10.223

  • Driver OSS Nvidia: 535.183.01

  • NVIDIA CUDA: 12.2

  • Programma di installazione EFA: 1.32.0

  • GDRCopy: 2.4

  • Toolkit per contenitori Nvidia: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 217.17,0

  • aws-neuronx-collectives: 2,21,46,0

Deep Learning EKS AMI 1.30
  • Componenti Amazon EKS

    • Versione Kubernetes: 1.30.2

    • Versione Containers: 1.7.20

    • Versione Runc: 1.1.11

    • AWS Autenticatore IAM: 0.6.21

  • Agente Amazon SSM: 3.3.380

  • Kernel Linux: 5.10.223

  • Driver OSS Nvidia: 535.183.01

  • NVIDIA CUDA: 12.2

  • Programma di installazione EFA: 1.32.0

  • GDRCopy: 2.4

  • Toolkit per contenitori Nvidia: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2,18,3,0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 217.17,0

  • aws-neuronx-collectives: 2,21,46,0