AWS Pembelajaran Mendalam AMI (Amazon Linux 2) - AWS Deep Learning AMIs

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AWS Pembelajaran Mendalam AMI (Amazon Linux 2)

Tip

Pelanggan yang menggunakan kerangka kerja tunggal seperti PyTorch atau TensorFlow didorong untuk menggunakan kerangka kerja tunggal yang DLAMIs disebutkan di sini

Untuk bantuan memulai, lihatMemulai dengan DLAMI.

Format nama AMI

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi $ {XX.X}

  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi $ {XX.X}

EC2 Contoh yang didukung

  • Silakan lihat Perubahan penting pada DLAMI.

  • Pembelajaran Mendalam dengan OSS Nvidia Driver mendukung G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5

  • Pembelajaran Mendalam dengan Driver Nvidia Proprietary mendukung G3 (G3.16x tidak didukung), P3, P3dn

AMI meliputi yang berikut:

  • AWS Layanan yang Didukung: Amazon EC2

  • Sistem Operasi: Amazon Linux 2

  • Arsitektur Komputasi: x86

  • Kerangka kerja lingkungan Conda dan versi python:

    • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2):

      • python3: Python 3.10

      • tensorflow2_p310:2.16, Python 3.10 TensorFlow

      • pytorch_p310:2.2, Python 3.10 PyTorch

    • AMI Driver Nvidia Milik Pembelajaran Mendalam (Amazon Linux 2):

      • python3: Python 3.10

      • tensorflow2_p310:2.16, Python 3.10 TensorFlow

      • pytorch_p310:2.2, Python 3.10 PyTorch

  • Pengemudi NVIDIA:

    • Pengemudi OSS Nvidia: 550.163.01

    • Driver Nvidia eksklusif: 550.163.01

  • NVIDIA CUDA12 .1-12.4 tumpukan:

    • Jalur instalasi CUDA, NCCL dan cudDN:/-xx.x/ usr/local/cuda

    • CUDA standar: 12.1

      • PATH/usr/local/cudamenunjuk ke CUDA12 .1

      • Diperbarui di bawah env vars:

        • LD_LIBRARY_PATH memiliki/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1:/usr/local/cuda-12.1/targets/x86_64-linux/lib

        • PATH untuk memiliki/usr/local/cuda-12.1/bin/:/usr/local/cuda-11.8/include/

      • Untuk versi CUDA yang berbeda, harap perbarui LD_LIBRARY_PATH yang sesuai.

    • Versi NCCL yang dikompilasi untuk CUDA 12.1-12.4:2.22.3

    • Lokasi Tes NCCL:

      • all_reduce, all_gather dan reduce_scatter:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test

      • Untuk menjalankan pengujian NCCL, LD_LIBRARY_PATH harus melewati pembaruan di bawah ini.

        • Umum sudah PATHs ditambahkan ke LD_LIBRARY_PATH:

          • /opt/amazon/efa/lib:/opt/amazon/openmpi/lib:/opt/aws-ofi-nccl/lib:/usr/local/lib:/usr/lib

        • Untuk versi CUDA yang berbeda, harap perbarui LD_LIBRARY_PATH yang sesuai.

  • Pemasang EFA: 1.38.0

  • GDRCopy: 2.4

  • AWS NCCL: 1.13.2

    • Lokasi sistem:/usr/local/cuda-xx.x/efa

    • Ini ditambahkan untuk menjalankan tes NCCL yang terletak di/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test

    • Juga, PyTorch paket dilengkapi dengan plugin AWS OFI NCCL yang ditautkan secara dinamis sebagai paket paket conda juga dan PyTorch akan menggunakan aws-ofi-nccl-dlc paket itu alih-alih sistem OFI NCCL. AWS

  • Lokasi Tes NCCL:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test

  • AWS CLI v2 di/usr/local/bin/aws2 dan AWS CLI v1 di/usr/local/bin/aws

  • Jenis volume EBS: gp3

  • Kueri AMI-ID dengan Parameter SSM (contoh wilayah adalah us-east-1):

    • Pengemudi OSS Nvidia:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/multi-framework-oss-nvidia-driver-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • Pengemudi Nvidia Berpemilik:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/multi-framework-proprietary-nvidia-driver-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • Kueri AMI-ID dengan AWSCLI (contoh wilayah adalah us-east-1):

    • Pengemudi OSS Nvidia:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • Pengemudi Nvidia Berpemilik:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

Pemberitahuan

Pembaruan EFA dari 1.37 ke 1.38 (Rilis pada 2025-02-05)

  • EFA sekarang menggabungkan plugin AWS OFI NCCL, yang sekarang dapat ditemukan di/-ofi-nccl/. opt/amazon/ofi-nccl rather than the original /opt/aws Jika memperbarui variabel LD_LIBRARY_PATH Anda, pastikan Anda memodifikasi lokasi OFI NCCL Anda dengan benar.

Penghapusan Lingkungan Neuron Conda

  • Deep Learning Proprietary Nvidia Driver yang AMIs dirilis setelah 18 Juli 2024 akan dikirim tanpa lingkungan neuron conda untuk dan. PyTorch TensorFlow Silakan gunakan DLAMIs Neuron pada Catatan Rilis DLAMI sebagai gantinya, untuk memanfaatkan lingkungan neuron.

Penghapusan Paket Audit

  • DLAMI yang dirilis antara 26 Maret 2024 (2024-03-26) dan 12 April 2024 (2024-04-12) dikirim tanpa paket audit. Jika Anda memerlukan paket khusus ini untuk kebutuhan pencatatan dan pemantauan Anda, silakan migrasi alur kerja Anda ke DLAMI terbaru untuk menggunakan paket audit yang diinstal.

Horovod

  • Horovod dihapus dari lingkungan conda pytorch_p310 dan tensorflow2_p310 saat ini di DLAMI. Pelanggan akan dapat menginstal perpustakaan horovod dengan mengikuti pedoman horovod dan menginstalnya DLAMIs untuk pekerjaan pelatihan terdistribusi mereka.

Tanggal Rilis: 2025-04-22

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 81.2

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 81.2

Diperbarui

Tanggal Rilis: 2025-02-17

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 80.6

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 80.4

Diperbarui

Dihapus

Tanggal Rilis: 2025-02-05

Nama AMI
  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 80.2

  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 80.4

Diperbarui

  • Versi EFA yang ditingkatkan dari 1.37.0 ke 1.38.0

    • EFA sekarang menggabungkan plugin AWS OFI NCCL, yang sekarang dapat ditemukan di/-ofi-nccl/. opt/amazon/ofi-nccl rather than the original /opt/aws Jika memperbarui variabel LD_LIBRARY_PATH Anda, pastikan Anda memodifikasi lokasi OFI NCCL Anda dengan benar.

Tanggal Rilis: 2025-01-15

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 80.3

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 80.1

Diperbarui

Tanggal Rilis: 2024-12-09

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 80.1

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 79.9

Diperbarui

  • Toolkit Kontainer Nvidia yang ditingkatkan dari versi 1.17.0 ke 1.17.3

Tanggal Rilis: 2024-11-11

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 79.9

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 79.7

Diperbarui

Tanggal Rilis: 2024-10-22

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 79.6

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 79.6

Diperbarui

Tanggal Rilis: 2024-10-03

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 79.3

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 79.3

Diperbarui

Tanggal Rilis: 2024-07-18

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 78.6

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 78.7

Diperbarui

  • Menghapus lingkungan conda aws_neuron_pytorch_p38 dan aws_neuron_tensorflow_p38 dari AMI Driver Nvidia Proprietary Deep Learning.

  • Menghapus dukungan keluarga instans Inf1 dari AMI Driver Nvidia Proprietary Deep Learning.

Tanggal Rilis: 2024-06-06

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 78.5

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 78.5

Diperbarui

  • Diperbarui versi driver Nvidia ke 535.183.01 dari 535.161.08

Tanggal Rilis: 2024-05-17

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 78.1

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 78.1

Diperbarui

Tanggal Rilis: 2024-05-07

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 78.0

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 78.0

Diperbarui

Ditambahkan

  • Ditambahkan CUDA12 .3 tumpukan CUDA12 dengan.3, NCCL 2.21.5, cuDNN 8.9.7

Dihapus

Tanggal Rilis: 2024-04-04

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 77.0

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 77.0

Diperbarui

  • PyTorch versi diperbarui dari 2.1 ke 2.2 di lingkungan pytorch_p310.

  • Untuk driver OSS Nvidia DLAMIs, menambahkan dukungan instans G6 dan Gr6 EC2 . Silakan lihat halaman pemilihan EC2 contoh untuk informasi lebih lanjut.

Tanggal Rilis: 2024-03-29

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 76.8

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 76.9

Diperbarui

  • Driver Nvidia yang diperbarui dari 535.104.12 ke 535.161.08 di driver Proprietary dan OSS Nvidia. DLAMIs

  • Instans baru yang didukung untuk setiap DLAMI adalah sebagai berikut:

    • Pembelajaran Mendalam dengan Driver Nvidia Proprietary mendukung G3 (G3.16x tidak didukung), P3, P3dn, Inf1

    • Pembelajaran Mendalam dengan OSS Nvidia Driver mendukung G4dn, G5, P4d, P4de.

Dihapus

  • Dukungan EC2 instans G4dn, G5, G3.16x yang dihapus dari DLAMI driver Nvidia Proprietary.

Versi 76.8

Tanggal Rilis: 2024-03-20

Nama AMI
  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 76.8

Ditambahkan

  • Menambahkan awscliv2 di AMI sebagai usr/local/bin/aws2, alongside awscliv1 as /usr/local/bin/aws /pada AMI Driver Nvidia Proprietary

Versi 76.7

Tanggal Rilis: 2024-03-20

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 76.7

Ditambahkan

  • Menambahkan awscliv2 di AMI sebagai usr/local/bin/aws2, alongside awscliv1 as /usr/local/bin/aws /pada OSS Nvidia Driver AMI

  • DLAMI driver OSS Nvidia yang diperbarui dengan dukungan G4dn dan G5, berdasarkan dukungan saat ini terlihat seperti di bawah ini:

    • Driver Nvidia Proprietary Deep Learning Base AMI (Amazon Linux 2) mendukung P3, P3dn, G3, G5, G4dn.

    • Basis Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) mendukung G4dn, G5, P4, P5.

  • Driver OSS Nvidia DLAMIs direkomendasikan untuk digunakan untuk G4dn, G5, P4, P5.

Versi 76.3

Tanggal Rilis: 2024-02-14

Diperbarui

  • Diperbarui TensorFlow dari 2.13.0 ke 2.15.0

  • Diperbarui EFA dari 1.29.0 ke 1.30.0

  • Diperbarui AWS-OFI-NCCL dari 1.7.3-aws ke 1.7.4-aws

  • Driver Nvidia yang Diperbarui ke 535.104.12 pada AMI Driver Nvidia Proprietary Deep Learning

  • Diperbarui Driver Nvidia ke 535.154.05 pada Deep Learning OSS Nvidia Driver AMI

Versi 76.2

Tanggal Rilis: 2024-02-02

Nama AMI
  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 76.2

  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 76.4

Keamanan

Versi 76.1

Tanggal Rilis: 2023-12-27

Diperbarui

  • Diperbarui PyTorch dari 2.0.1 ke 2.1.0

Versi 75.1

Tanggal Rilis: 2023-11-17

Silakan lihat Perubahan penting pada DLAMI

Nama AMI
  • Pembelajaran Mendalam OSS Nvidia Driver AMI (Amazon Linux 2) Versi 75.1

  • Driver Nvidia Proprietary Deep Learning AMI (Amazon Linux 2) Versi 75.1

Ditambahkan

  • AWS Deep Learning AMI (DLAMI) dibagi menjadi dua kelompok terpisah:

    • DLAMI yang menggunakan Nvidia Proprietary Driver (untuk mendukung P3, P3dn, G3, G5, G4dn).

    • DLAMI yang menggunakan Nvidia OSS Driver untuk mengaktifkan EFA (untuk mendukung P4, P5).

  • Silakan merujuk ke pengumuman publik untuk informasi lebih lanjut tentang DLAMI split.

  • AWS kueri cli untuk di atas ada di catatan rilis di bawah bullet point Query AMI-ID dengan ( AWSCLI contoh wilayah adalah us-east-1)

Diperbarui

  • EFA diperbarui dari 1.26.1 ke 1.29.0

  • GDRCopy diperbarui dari 2.3 ke 2.4

Versi 74.4

Tanggal Rilis: 2023-10-27

Diperbarui

Ditambahkan

  • Kernel Live Patching sekarang diaktifkan. Live patching memungkinkan pelanggan untuk menerapkan kerentanan keamanan dan patch bug kritis ke kernel Linux yang sedang berjalan, tanpa reboot atau gangguan pada aplikasi yang sedang berjalan.

Versi 74.0

Tanggal Rilis: 2023-07-19

Diperbarui

  • Diperbarui TensorFlow dari 2.12 ke 2.13

    • Horovod telah dihapus dari lingkungan conda dalam rilis ini. Lihat Pemberitahuan untuk detail tentang menginstal horovod.

Versi 73.1

Tanggal Rilis: 2023-06-12

Diperbarui

  • Diperbarui PyTorch dari 2.0.0 ke 2.0.1