AWS GPU ARM64 Basis Pembelajaran Mendalam AMI (Amazon Linux 2023) - AWS Deep Learning AMIs

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AWS GPU ARM64 Basis Pembelajaran Mendalam AMI (Amazon Linux 2023)

Untuk bantuan memulai, lihatMemulai dengan DLAMI.

Format nama AMI

  • ARM64 Basis Pembelajaran Mendalam OSS Nvidia Driver GPU AMI (Amazon Linux 2023) $ {YYYY-MM-DD}

EC2 Contoh yang didukung

  • G5g

AMI meliputi yang berikut:

  • AWS Layanan yang Didukung: Amazon EC2

  • Sistem Operasi: Amazon Linux 2023

  • Arsitektur Komputasi: ARM64

  • Kernel Linux: 6.12

  • Pengemudi NVIDIA: 570.133.20

  • NVIDIA CUDA 12.4, 12,5, 12.6, 12.8 tumpukan:

    • Direktori instalasi CUDA, NCCL dan cudDN:/-xx.x/ usr/local/cuda

      • Contoh:/usr/local/cuda-12.8/ , /usr/local/cuda-12.8/

    • Versi NCCL yang dikompilasi:

      • Untuk direktori CUDA 12.4, dikompilasi NCCL Versi 2.22.3+ .4 CUDA12

      • Untuk direktori CUDA 12.5, dikompilasi NCCL Versi 2.22.3+ .5 CUDA12

      • Untuk direktori CUDA 12.6, dikompilasi NCCL Versi 2.24.3+ .6 CUDA12

      • Untuk direktori CUDA 12.8, dikompilasi NCCL Versi 2.26.2+ .8 CUDA12

    • CUDA standar: 12.8

      • PATH/usr/local/cudamenunjuk ke CUDA 12.8

      • Diperbarui di bawah env vars:

        • LD_LIBRARY_PATH memiliki/64 usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib

        • PATH untuk memiliki/usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/

        • Untuk versi CUDA yang berbeda, harap perbarui LD_LIBRARY_PATH yang sesuai.

  • AWS CLI v2 di/usr/local/bin/aws

  • Jenis volume EBS: gp3

  • Toolkit wadah Nvidia: 1.17.4

    • Perintah versi: nvidia-container-cli -V

  • Docker: 25.0.5

  • Python:/3.9 usr/bin/python

  • Kueri AMI-ID dengan Parameter SSM (contoh wilayah adalah us-east-1):

    aws ssm get-parameter --name/aws/service/deeplearning/ami/arm64/base-oss-nvidia-driver-gpu-amazon-linux-2023/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • Kueri AMI-ID dengan AWSCLI (contoh wilayah adalah us-east-1):

    aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning ARM64 Base OSS Nvidia Driver GPU AMI (Amazon Linux 2023) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

Pemberitahuan

Toolkit Kontainer NVIDIA 1.17.4

Dalam Container Toolkit versi 1.17.4 pemasangan pustaka compat CUDA sekarang dinonaktifkan. Untuk memastikan kompatibilitas dengan beberapa versi CUDA pada alur kerja kontainer, pastikan Anda memperbarui LD_LIBRARY_PATH Anda untuk menyertakan pustaka kompatibilitas CUDA Anda seperti yang ditunjukkan dalam tutorial Jika Anda menggunakan lapisan kompatibilitas CUDA.

Kebijakan Support

AMIs Komponen versi AMI seperti CUDA ini dapat dihapus dan diubah berdasarkan kebijakan dukungan kerangka kerja atau untuk mengoptimalkan kinerja untuk wadah pembelajaran mendalam atau untuk mengurangi ukuran AMI di rilis mendatang, tanpa pemberitahuan sebelumnya. Kami menghapus versi CUDA dari AMIs jika tidak digunakan oleh versi kerangka kerja yang didukung.

Kernel
  • Versi kernel disematkan menggunakan perintah:

    sudo dnf versionlock kernel*
  • Kami menyarankan agar pengguna menghindari memperbarui versi kernel mereka (kecuali karena patch keamanan) untuk memastikan kompatibilitas dengan driver dan versi paket yang diinstal. Jika pengguna masih ingin memperbarui, mereka dapat menjalankan perintah berikut untuk melepas pin versi kernel mereka:

    sudo dnf versionlock delete kernel* sudo dnf update -y
  • Untuk setiap versi baru DLAMI, kernel kompatibel terbaru yang tersedia digunakan.

Tanggal Rilis: 2025-04-24

Nama AMI: ARM64 Basis Pembelajaran Mendalam OSS Nvidia Driver GPU AMI (Amazon Linux 2023) 20250424

Diperbarui

Tanggal Rilis: 2025-04-22

Nama AMI: ARM64 Basis Pembelajaran Mendalam OSS Nvidia Driver GPU AMI (Amazon Linux 2023) 20250421

Diperbarui

Tanggal Rilis: 2025-04-04

Nama AMI: ARM64 Basis Pembelajaran Mendalam OSS Nvidia Driver GPU AMI (Amazon Linux 2023) 20250404

Diperbarui

  • Versi kernel diperbarui dari 6.1 ke 6.12

Tanggal Rilis: 2025-03-03

Nama AMI: ARM64 Basis Pembelajaran Mendalam OSS Nvidia Driver GPU AMI (Amazon Linux 2023) 20250303

Diperbarui

  • Driver Nvidia dari 550.144.03 ke 570.86.15

  • CUDA default diubah dari CUDA12 .4 menjadi .6 CUDA12

Ditambahkan

  • Direktori CUDA 12.5 dengan dikompilasi NCCL Versi CUDA12 2.22.3+ .5 dan cuDNN 9.7.1.26

  • Direktori CUDA 12.6 dengan dikompilasi NCCL Versi CUDA12 2.24.3+ .6 dan cuDNN 9.7.1.26

  • Direktori CUDA 12.8 dengan dikompilasi NCCL Versi CUDA12 2.25.1+ .8 dan cuDNN 9.7.1.26

Tanggal Rilis: 2025-02-14

Nama AMI: ARM64 Basis Pembelajaran Mendalam OSS Nvidia Driver GPU AMI (Amazon Linux 2023) 20250214

Ditambahkan

  • Rilis awal Deep Learning ARM64 Base OSS DLAMI untuk Amazon Linux 2023