SageMaker HyperPod Rilis AMI untuk Amazon EKS - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

SageMaker HyperPod Rilis AMI untuk Amazon EKS

Catatan rilis berikut melacak pembaruan terbaru untuk rilis Amazon SageMaker HyperPod AMI untuk orkestrasi Amazon EKS. Setiap catatan rilis menyertakan daftar paket yang telah diinstal sebelumnya atau dikonfigurasi sebelumnya dalam dukungan untuk SageMaker HyperPod DLAMIs Amazon EKS. Setiap DLAMI dibangun di Amazon Linux 2 AL2 () dan mendukung versi Kubernetes tertentu. Untuk rilis HyperPod DLAMI untuk orkestrasi Slurm, lihat. SageMaker HyperPod Rilis AMI untuk Slurm Untuk informasi tentang rilis SageMaker HyperPod fitur Amazon, lihatCatatan SageMaker HyperPod rilis Amazon.

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 09 Juni 2025

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.21.37.0 (dari 2.20.74.0)

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 22 Mei 2025

Pembaruan umum AMI

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

Deep Learning Base AMI AL2
  • Driver NVIDIA terbaru: 550.163.01

  • Pembaruan CUDA Stack:

    • CUDA standar: 12.1

    • Versi NCCL: 2.22.3

  • Pemasang EFA: 1.38.0

  • AWS NCCL: 1.13.2

  • Kernel Linux: 5.10

  • GDRCopy: 2.4

penting
  • Pembaruan NVIDIA Container Toolkit 1.17.4: Pemasangan pustaka compat CUDA sekarang dinonaktifkan

  • Pembaruan EFA dari 1,37 hingga 1,38:

    • AWS Plugin OFI NCCL sekarang terletak di/-nccl opt/amazon/ofi

    • Lokasi sebelumnya /opt//aws-ofi-nccltidak digunakan lagi

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (dari 2.20.28.0)

  • aws-neuronx-collectives.x86_64:2.25.65.0_9858ac9a1-1 (dari 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64:2.25.57.0_166c7a468-1 (dari 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64:2.23.9.0 (dari 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (dari 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64:0.15.1.0_5d31b6a3f (dari 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (dari 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (dari 2.24.23.0)

Catatan Support:

  • Komponen AMI termasuk versi CUDA dapat dihapus atau diubah berdasarkan kebijakan dukungan kerangka kerja

  • Versi kernel disematkan untuk kompatibilitas. Pengguna harus menghindari pembaruan kecuali diperlukan untuk patch keamanan

  • Untuk EC2 contoh dengan beberapa kartu jaringan, silakan merujuk ke panduan konfigurasi EFA untuk pengaturan yang tepat

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 07 Mei 2025

Installed the latest version of AWS Neuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 neuron

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 28 April 2025

Perbaikan untuk K8

  • Driver NVIDIA yang ditingkatkan dari versi 550.144.03 ke 550.163.01. Peningkatan ini untuk mengatasi Kerentanan dan Eksposur Umum (CVEs) yang ada di Buletin Keamanan Tampilan GPU NVIDIA untuk April 2025.

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

Installed the latest version of AWS Neuron SDK
  • aws-neuronx-dkms.noarch: 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

  • aws-neuronx-tools.x86_64: 2.18.3.0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64:2.24.59.0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64:0.14.12.0-1

  • aws-neuronx-gpsimd-tools.x86_64:0.14.6.0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64: 2.24.23.0-1

  • aws-neuronx-k8-scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64: 2.24.53.0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2.22.61.0-1

  • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 18 April 2025

Pembaruan umum AMI

  • SageMaker HyperPod AMI baru untuk Amazon EKS 1.32.1.

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

AMIs Ini termasuk yang berikut:

Deep Learning EKS AMI 1.32.1
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.32.1

    • Versi Containerd: 1.7.27

    • Versi Runc: 1.1.14

    • AWS Autentikator IAM: 0.6.29

  • Agen SSM Amazon: 3.3.1611.0

  • Kernel Linux: 5.10.235

  • Pengemudi OSS Nvidia: 550.163.01

  • NVIDIA CUDA: 12.4

  • Pemasang EFA: 1.38.0

  • GDRCopy: 2.4.1-1

  • Toolkit wadah Nvidia: 1.17.6

  • AWS NCCL: 1.13.2

  • aws-neuronx-tools: 2.18.3.0

  • aws-neuronx-runtime-lib: 2.24.53.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.20.28.0

  • aws-neuronx-collectives: 2.24.59.0

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 18 Februari 2025

Perbaikan untuk K8

  • Toolkit kontainer Nvidia yang ditingkatkan dari versi 1.17.3 ke versi 1.17.4.

  • Memperbaiki masalah di mana pelanggan tidak dapat terhubung ke node setelah reboot.

  • Versi Elastic Fabric Adapter (EFA) yang ditingkatkan dari 1.37.0 ke 1.38.0.

  • EFA sekarang menyertakan plugin AWS OFI NCCL, yang terletak di /opt/amazon/ofi-nccl direktori alih-alih jalur asli. /opt/aws-ofi-nccl/ Jika Anda perlu memperbarui variabel LD_LIBRARY_PATH lingkungan Anda, pastikan untuk memodifikasi jalur untuk menunjuk ke /opt/amazon/ofi-nccl lokasi baru untuk plugin OFI NCCL.

  • Menghapus paket emacs dari ini DLAMIs. Anda dapat menginstal emacs dari GNU emac.

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64: 2.18.3.0-1 @neuron

  • aws-neuronx-collectives.x86_64:2.23.135.0_3e70920f2-1 neuron

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1 neuron

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64:0.13.2.0_94ba34927-1 neuron

  • aws-neuronx-k8-plugin.x86_64: 2.23.45.0-1 neuron

  • aws-neuronx-k8-scheduler.x86_64: 2.23.45.0-1 neuron

  • aws-neuronx-runtime-lib.x86_64:2.23.112.0_9b5179492-1 neuron

  • aws-neuronx-tools.x86_64: 2.20.204.0-1 neuron

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 22 Januari 2025

Pembaruan umum AMI

  • SageMaker HyperPod AMI baru untuk Amazon EKS 1.31.2.

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

AMIs Ini termasuk yang berikut:

Deep Learning EKS AMI 1.31
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.31.2

    • Versi Containerd: 1.7.23

    • Versi Runc: 1.1.14

    • AWS Autentikator IAM: 0.6.26

  • Agen SSM Amazon: 3.3.987

  • Kernel Linux: 5.10.230

  • Pengemudi OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Pemasang EFA: 1.37.0

  • GDRCopy: 2.4.1-1

  • Toolkit wadah Nvidia: 1.17.3

  • AWS NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.133.0

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 21 Desember 2024

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

AMIs Ini termasuk yang berikut:

K8s v1.28
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.28.15

    • Versi Containerd: 1.7.23

    • Versi Runc: 1.1.14

    • AWS Autentikator IAM: 0.6.26

  • Agen SSM Amazon: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Pemasang EFA: 1.37.0

  • GDRCopy: 2.4

  • Toolkit wadah NVIDIA: 1.17.3

  • AWS NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.29
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.29.10

    • Versi Containerd: 1.7.23

    • Versi Runc: 1.1.14

    • AWS Autentikator IAM: 0.6.26

  • Agen SSM Amazon: 3.3.987

  • Kernel Linux: 5.15.0

  • Pengemudi OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Pemasang EFA: 1.37.0

  • GDRCopy: 2.4

  • Toolkit wadah Nvidia: 1.17.3

  • AWS NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

K8s v1.30
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.30.6

    • Versi Containerd: 1.7.23

    • Versi Runc: 1.1.14

    • AWS Autentikator IAM: 0.6.26

  • Agen SSM Amazon: 3.3.987.0

  • Kernel Linux: 5.10.228

  • Pengemudi OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Pemasang EFA: 1.37.0

  • GDRCopy: 2.4

  • Toolkit wadah Nvidia: 1.17.3

  • AWS NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.23.112.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.23.135.0

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 13 Desember 2024

SageMaker HyperPod DLAMI untuk peningkatan Amazon EKS

  • Diperbarui Agen SSM ke versi3.3.1311.0.

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 24 November 2024

Pembaruan umum AMI

  • Dirilis di Wilayah MEL (Melbourne).

  • Diperbarui DLAMI SageMaker HyperPod dasar ke versi berikut:

    • Kubernetes: 2024-11-01.

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 15 November 2024

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

AMIs Ini termasuk yang berikut:

Deep Learning EKS AMI 1.28
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.28.15

    • Versi Containerd: 1.7.23

    • Versi Runc: 1.1.14

    • AWS Autentikator IAM: 0.6.26

  • Agen SSM Amazon: 3.3.987

  • Kernel Linux: 5.10.228

  • Driver OSS NVIDIA: 550.127.05

  • NVIDIA CUDA: 12.4

  • Pemasang EFA: 1.34.0

  • GDRCopy: 2.4

  • Toolkit wadah NVIDIA: 1.17.3

  • AWS NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.29
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.29.10

    • Versi Containerd: 1.7.23

    • Versi Runc: 1.1.14

    • AWS Autentikator IAM: 0.6.26

  • Agen SSM Amazon: 3.3.987

  • Kernel Linux: 5.10.228

  • Pengemudi OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Pemasang EFA: 1.34.0

  • GDRCopy: 2.4

  • Toolkit wadah Nvidia: 1.17.3

  • AWS NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

Deep Learning EKS AMI 1.30
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.30.6

    • Versi Containerd: 1.7.23

    • Versi Runc: 1.1.14

    • AWS Autentikator IAM: 0.6.26

  • Agen SSM Amazon: 3.3.987

  • Kernel Linux: 5.10.228

  • Pengemudi OSS Nvidia: 550.127.05

  • NVIDIA CUDA: 12.4

  • Pemasang EFA: 1.34.0

  • GDRCopy: 2.4

  • Toolkit wadah Nvidia: 1.17.3

  • AWS NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.18.20.0

  • aws-neuronx-collectives: 2.22.33.0

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 11 November 2024

Pembaruan umum AMI

  • SageMaker HyperPod DLAMI yang diperbarui dengan Amazon EKS versi 1.28.13, 1.29.8, 1.30.4.

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 21 Oktober 2024

Pembaruan umum AMI

  • Diperbarui DLAMI SageMaker HyperPod dasar ke versi berikut:

    • Amazon EKS: 1.28.11, 1.29.6, 1.30.2.

SageMaker HyperPod Rilis AMI untuk Amazon EKS: 10 September 2024

SageMaker HyperPod DLAMI untuk dukungan Amazon EKS

AMIs Ini termasuk yang berikut:

Deep Learning EKS AMI 1.28
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.28.11

    • Versi Containerd: 1.7.20

    • Versi Runc: 1.1.11

    • AWS Autentikator IAM: 0.6.21

  • Agen SSM Amazon: 3.3.380

  • Kernel Linux: 5.10.223

  • Pengemudi OSS NVIDIA: 535.183.01

  • NVIDIA CUDA: 12.2

  • Pemasang EFA: 1.32.0

  • GDRCopy: 2.4

  • Toolkit wadah NVIDIA: 1.16.1

  • AWS NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.29
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.29.6

    • Versi Containerd: 1.7.20

    • Versi Runc: 1.1.11

    • AWS Autentikator IAM: 0.6.21

  • Agen SSM Amazon: 3.3.380

  • Kernel Linux: 5.10.223

  • Pengemudi OSS Nvidia: 535.183.01

  • NVIDIA CUDA: 12.2

  • Pemasang EFA: 1.32.0

  • GDRCopy: 2.4

  • Toolkit wadah Nvidia: 1.16.1

  • AWS NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0

Deep Learning EKS AMI 1.30
  • Komponen Amazon EKS

    • Versi Kubernetes: 1.30.2

    • Versi Containerd: 1.7.20

    • Versi Runc: 1.1.11

    • AWS Autentikator IAM: 0.6.21

  • Agen SSM Amazon: 3.3.380

  • Kernel Linux: 5.10.223

  • Pengemudi OSS Nvidia: 535.183.01

  • NVIDIA CUDA: 12.2

  • Pemasang EFA: 1.32.0

  • GDRCopy: 2.4

  • Toolkit wadah Nvidia: 1.16.1

  • AWS NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.21.41.0

  • aws-neuronx-oci-hook: 2.4.4.0-1

  • aws-neuronx-dkms: 2.17.17.0

  • aws-neuronx-collectives: 2.21.46.0