SageMaker HyperPod AMI-Versionen für Amazon EKS - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SageMaker HyperPod AMI-Versionen für Amazon EKS

In den folgenden Versionshinweisen werden die neuesten Updates für Amazon SageMaker HyperPod AMI-Versionen für Amazon EKS-Orchestration beschrieben. Jeder Versionshinweis enthält eine zusammengefasste Liste der Pakete, die im Amazon EKS-Support vorinstalliert oder vorkonfiguriert sind. SageMaker HyperPod DLAMIs Jedes DLAMI basiert auf Amazon Linux 2 (AL2) und unterstützt eine bestimmte Kubernetes-Version. Informationen zu HyperPod DLAMI-Releases für Slurm-Orchestrierung finden Sie unter. SageMaker HyperPod AMI-Veröffentlichungen für Slurm Informationen zu SageMaker HyperPod Feature-Releases von Amazon finden Sie unter SageMaker HyperPod Versionshinweise von Amazon.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 22. Mai 2025

Allgemeine AMI-Updates

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Deep Learning Base AMI AL2
  • Neuester NVIDIA-Treiber: 550.163.01

  • CUDA Stack-Aktualisierungen:

    • Standard-CUDA: 12.1

    • NCCL-Version: 2.22.3

  • EFA-Installationsprogramm: 1.38.0

  • AWS OFI NCCL: 1.13.2

  • Linux-Kernel: 5.10

  • GDRCopy: 2,4

Wichtig
  • NVIDIA Container Toolkit 1.17.4-Update: Das Mounten von CUDA-kompatiblen Bibliotheken ist jetzt deaktiviert

  • EFA-Updates von 1.37 auf 1.38:

    • AWS Das OFI-NCCL-Plugin befindet sich jetzt in/-nccl opt/amazon/ofi

    • Der vorherige Speicherort /opt//ist veraltet aws-ofi-nccl

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (von 2.20.28.0)

  • aws-neuronx-collectives.x86_64:2.25.65.0_9858ac9a1-1 (von 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64: 2.25.57.0_166c7a468-1 (von 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64: 2.23.9.0 (von 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (von 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64:0.15.1.0_5d31b6a3f (von 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (von 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (von 2.24.23.0)

Hinweise zur Support:

  • AMI-Komponenten, einschließlich CUDA-Versionen, können je nach Framework-Supportrichtlinie entfernt oder geändert werden.

  • Die Kernel-Version ist aus Kompatibilitätsgründen festgelegt. Benutzer sollten Updates vermeiden, sofern sie nicht für Sicherheitspatches erforderlich sind

  • Informationen zur korrekten Einrichtung finden Sie im EFA-Konfigurationsleitfaden für EC2 Instanzen mit mehreren Netzwerkkarten

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 07. Mai 2025

Installed the latest version of AWS Neuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 Neuron

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 28. April 2025

Verbesserungen für K8s

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Installed the latest version of AWS Neuron SDK
  • aws-neuronx-dkms.noarch: 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

  • aws-neuronx-tools.x86_64:2.18.3.0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-Scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64:2,24,59,0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64:0,2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64:0,14.12.0-1

  • aws-neuronx-gpsimd-tools.x86_64:0,14.6.0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64:2.24.23.0-1

  • aws-neuronx-k8-Scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64:2.24.53.0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2,22.61,0-1

  • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 18. April 2025

Allgemeine AMI-Updates

  • Neues SageMaker HyperPod AMI für Amazon EKS 1.32.1.

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

Deep Learning EKS AMI 1.32.1
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.32.1

    • Enthaltene Version: 1.7.27

    • Runc-Version: 1.1.14

    • AWS IAM-Authentifikator: 0.6.29

  • Amazon SSM-Agent: 3.3.1611.0

  • Linux-Kernel: 5.10.235

  • OSS Nvidia-Treiber: 550.163.01

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.38.0

  • GDRCopy: 2.4.1-1

  • Nvidia-Container-Toolkit: 1.17.6

  • AWS OFI NCCL: 1.13.2

  • aws-neuronx-tools: 2,18,3,0

  • aws-neuronx-runtime-lib: 2,24,53,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,20,28,0

  • aws-neuronx-collectives: 2,24,59,0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 18. Februar 2025

Verbesserungen für K8s

  • Das Nvidia-Container-Toolkit wurde von Version 1.17.3 auf Version 1.17.4 aktualisiert.

  • Das Problem, dass Kunden nach einem Neustart keine Verbindung zu Knoten herstellen konnten, wurde behoben.

  • Die Version des Elastic Fabric Adapter (EFA) wurde von 1.37.0 auf 1.38.0 aktualisiert.

  • Die EFA enthält jetzt das AWS OFI-NCCL-Plugin, das sich im Verzeichnis statt im ursprünglichen Pfad befindet. /opt/amazon/ofi-nccl /opt/aws-ofi-nccl/ Wenn Sie Ihre LD_LIBRARY_PATH Umgebungsvariable aktualisieren müssen, achten Sie darauf, den Pfad so zu ändern, dass er auf den neuen /opt/amazon/ofi-nccl Speicherort für das OFI-NCCL-Plugin verweist.

  • Das Emacs-Paket wurde von diesen entfernt. DLAMIs Sie können Emacs von GNU Emac aus installieren.

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64: 2.18.3.0-1 @neuron

  • aws-neuronx-collectives.x86_64:2.23.135.0_3e70920f2-1-Neuron

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1 Neuron

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64:0.13.2.0_94ba34927-1 Neuron

  • aws-neuronx-k8-plugin.x86_64: 2.23.45.0-1 Neuron

  • aws-neuronx-k8-Scheduler.x86_64: 2.23.45.0-1 Neuron

  • aws-neuronx-runtime-lib.x86_64:2.23.112.0_9b5179492-1 Neuron

  • aws-neuronx-tools.x86_64:2.20.204.0-1 Neuron

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 22. Januar 2025

Allgemeine AMI-Updates

  • Neues SageMaker HyperPod AMI für Amazon EKS 1.31.2.

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

Deep Learning EKS AMI 1.31
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.31.2

    • Enthaltene Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWS IAM-Authentifikator: 0.6.26

  • Amazon SSM-Agent: 3.3.987

  • Linux-Kernel: 5.10.230

  • OSS Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.37.0

  • GDRCopy: 2.4.1-1

  • Nvidia-Container-Toolkit: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2,18,3

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,133,0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 21. Dezember 2024

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

K8s v1.28
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.28.15

    • Enthaltene Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWS IAM-Authentifikator: 0.6.26

  • Amazon SSM-Agent: 3.3.987

  • Linux-Kernel: 5.10.228

  • OSS NVIDIA-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.37.0

  • GDRCopy: 2,4

  • NVIDIA-Container-Toolkit: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.29
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.29.10

    • Enthaltene Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWS IAM-Authentifikator: 0.6.26

  • Amazon SSM-Agent: 3.3.987

  • Linux-Kernel: 5.15.0

  • OSS Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.37.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.30
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.30.6

    • Enthaltene Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWS IAM-Authentifikator: 0.6.26

  • Amazon SSM-Agent: 3.3.987,0

  • Linux-Kernel: 5.10.228

  • OSS Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.37.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.17.3

  • AWS OFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 13. Dezember 2024

SageMaker HyperPod Aktualisierung von DLAMI für Amazon EKS

  • Der SSM-Agent wurde auf Version aktualisiert. 3.3.1311.0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 24. November 2024

Allgemeine AMI-Updates

  • Veröffentlicht in der Region MEL (Melbourne).

  • SageMaker HyperPod Basis-DLAMI wurde auf die folgenden Versionen aktualisiert:

    • Kubernetes: 2024-11-01.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 15. November 2024

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

Deep Learning EKS AMI 1.28
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.28.15

    • Enthaltene Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWS IAM-Authentifikator: 0.6.26

  • Amazon SSM-Agent: 3.3.987

  • Linux-Kernel: 5.10.228

  • OSS NVIDIA-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.34.0

  • GDRCopy: 2,4

  • NVIDIA-Container-Toolkit: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22,33,0

Deep Learning EKS AMI 1.29
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.29.10

    • Enthaltene Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWS IAM-Authentifikator: 0.6.26

  • Amazon SSM-Agent: 3.3.987

  • Linux-Kernel: 5.10.228

  • OSS Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.34.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22,33,0

Deep Learning EKS AMI 1.30
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.30.6

    • Enthaltene Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWS IAM-Authentifikator: 0.6.26

  • Amazon SSM-Agent: 3.3.987

  • Linux-Kernel: 5.10.228

  • OSS Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.34.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.17.3

  • AWS OFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22,33,0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 11. November 2024

Allgemeine AMI-Updates

  • SageMaker HyperPod DLAMI mit den Amazon EKS-Versionen 1.28.13, 1.29.8, 1.30.4 aktualisiert.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 21. Oktober 2024

Allgemeine AMI-Updates

  • SageMaker HyperPod Basis-DLAMI wurde auf die folgenden Versionen aktualisiert:

    • Amazon EKS: 1,28,11, 1,29,6, 1,30,2.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 10. September 2024

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

Deep Learning EKS AMI 1.28
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.28.11

    • Enthaltene Version: 1.7.20

    • Runc-Version: 1.1.11

    • AWS IAM-Authentifikator: 0.6.21

  • Amazon SSM-Agent: 3.3.380

  • Linux-Kernel: 5.10.223

  • OSS NVIDIA-Treiber: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA-Installationsprogramm: 1.32.0

  • GDRCopy: 2,4

  • NVIDIA-Container-Toolkit: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2.17.17,0

  • aws-neuronx-collectives: 2,21,46,0

Deep Learning EKS AMI 1.29
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.29.6

    • Enthaltene Version: 1.7.20

    • Runc-Version: 1.1.11

    • AWS IAM-Authentifikator: 0.6.21

  • Amazon SSM-Agent: 3.3.380

  • Linux-Kernel: 5.10.223

  • OSS Nvidia-Treiber: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA-Installationsprogramm: 1.32.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2.17.17,0

  • aws-neuronx-collectives: 2,21,46,0

Deep Learning EKS AMI 1.30
  • Amazon EKS-Komponenten

    • Kubernetes-Version: 1.30.2

    • Enthaltene Version: 1.7.20

    • Runc-Version: 1.1.11

    • AWS IAM-Authentifikator: 0.6.21

  • Amazon SSM-Agent: 3.3.380

  • Linux-Kernel: 5.10.223

  • OSS Nvidia-Treiber: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA-Installationsprogramm: 1.32.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.16.1

  • AWS OFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2.17.17,0

  • aws-neuronx-collectives: 2,21,46,0