AWS Pembelajaran Mendalam AMI GPU TensorFlow 2.16 (Amazon Linux 2) - AWS Deep Learning AMIs

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AWS Pembelajaran Mendalam AMI GPU TensorFlow 2.16 (Amazon Linux 2)

Untuk bantuan memulai, lihatMemulai dengan DLAMI.

Format nama AMI

  • Driver Nvidia Proprietary Pembelajaran Mendalam AMI GPU TensorFlow 2.16 (Amazon Linux 2) $ {YYYY-MM-DD}

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) $ {YYYY-MM-DD}

EC2 Contoh yang didukung

  • Silakan lihat Perubahan penting pada DLAMI.

  • Pembelajaran Mendalam dengan OSS Nvidia Driver mendukung G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en.

  • Pembelajaran Mendalam dengan Driver Nvidia Proprietary mendukung G3 (G3.16x tidak didukung), P3, P3dn

AMI meliputi yang berikut:

  • AWS Layanan yang Didukung: EC2

  • Sistem Operasi: Amazon Linux 2

  • Arsitektur Komputasi: x86

  • Python:/3.10 opt/tensorflow/bin/python

  • TensorFlow versi: 2.16

  • Pengemudi NVIDIA:

    • Pengemudi OSS Nvidia: 550.144.03

    • Driver Nvidia eksklusif: 550.144.03

  • CUDA12 Tumpukan NVIDIA:

    • Jalur instalasi CUDA, NCCL dan cudDN:/-12.2/ usr/local/cuda

  • Pemasang EFA: 1.34.0

  • AWS CLI v2 sebagai aws2 dan AWS CLI v1 sebagai aws

  • Jenis volume EBS: gp3

  • Kueri AMI-ID dengan Parameter SSM (contoh wilayah adalah us-east-1):

    • Pengemudi OSS Nvidia:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • Pengemudi Nvidia Berpemilik:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • Kueri AMI-ID dengan AWSCLI (contoh wilayah adalah us-east-1):

    • Pengemudi OSS Nvidia:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • Pengemudi Nvidia Berpemilik:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

Pemberitahuan

Toolkit Kontainer NVIDIA 1.17.4

Dalam Container Toolkit versi 1.17.4 pemasangan pustaka compat CUDA sekarang dinonaktifkan. Untuk memastikan kompatibilitas dengan beberapa versi CUDA pada alur kerja kontainer, pastikan Anda memperbarui LD_LIBRARY_PATH Anda untuk menyertakan pustaka kompatibilitas CUDA Anda seperti yang ditunjukkan di bawah tutorial “Jika Anda menggunakan lapisan kompatibilitas CUDA” di sini - -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat

Pembaruan Sistem TensorFlow Operasi Masa Depan

TensorFlow 2.16 akan menjadi DLAMI terakhir yang menggunakan Sistem Operasi Ubuntu 20.04. Dimulai dengan TensorFlow 2.17 ke atas, DLAMIs akan mulai memanfaatkan Ubuntu 22.04 sebagai dasar Sistem Operasi. Untuk pelanggan yang ingin meningkatkan ke versi baru ini, pastikan alur kerja Anda siap untuk peningkatan ini.

Versi Keras disematkan ke 2.0, bukan 3.0

Dengan rilis terbaru TF2 .16, Keras telah ditingkatkan dari mayor versi 2 ke mayor versi 3.0. Versi Keras ini adalah penulisan ulang lengkap paket Keras (silakan lihat dokumentasi Keras 3 untuk informasi lebih lanjut). Untuk memastikan kompatibilitas dengan alur kerja pelanggan, kami telah menyematkan versi Keras ke 2.0 menggunakan variabel lingkungan TF_USE_LEGACY_KERAS=1. Jika alur kerja Anda memerlukan penggunaan Keras 3.0, hapus variabel lingkungan ini dari lingkungan TensorFlow virtual /opt/tensorflow Anda menggunakan skrip berikut:

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS

Tanggal Rilis: 2025-02-17

Nama AMI:

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215

  • Driver Nvidia Proprietary Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215

Diperbarui
Dihapus

Tanggal Rilis: 2025-01-20

Nama AMI:

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250120

  • Driver Nvidia Proprietary Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250118

Diperbarui

Tanggal Rilis: 2024-10-23

Nama AMI:

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241022

  • Driver Nvidia Proprietary Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241023

Diperbarui

Tanggal Rilis: 2024-09-28

Nama AMI:

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

  • Driver Nvidia Proprietary Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

Diperbarui

Tanggal Rilis: 2024-09-21

Nama AMI:

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

  • Driver Nvidia Proprietary Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

Diperbarui
  • Driver Nvidia dan Fabric Manager yang ditingkatkan dari versi 535.183.01 ke 550.90.07

  • Versi EFA yang ditingkatkan dari 1.32.0 ke 1.34.0

  • PyTorch Versi yang diperbarui dari versi 2.3.0 ke 2.3.1

Ditambahkan
  • Menambahkan dukungan untuk EC2 Instans P5e pada Gambar Driver OSS Nvidia.

Tanggal Rilis: 2024-08-19

Nama AMI:

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240817

Ditambahkan
  • Ditambahkan dukungan untuk contoh G6e EC2 .

Versi 2.16.2 - Tanggal Rilis: 2024-07-26

Nama AMI:

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240725

Diperbarui
  • Diperbarui versi TensorFlow patch dari versi 2.16.1 ke 2.16.2

  • Diselesaikan versi TensorFlow minor yang salah dalam DLAMI dirilis pada 2024-07-17

    • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240717 rilis secara tidak sengaja berisi versi minor 2.17 daripada 2.16. TensorFlow Pastikan alur kerja yang bergantung pada TensorFlow 2.16 ditingkatkan ke DLAMI terbaru.

Versi 2.16.1 - Tanggal Rilis: 2024-06-10

Nama AMI:

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240607

  • Driver Nvidia Proprietary Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240610

Diperbarui
  • Diperbarui versi driver Nvidia ke 535.183.01 dari 535.161.08

Tanggal Rilis: 2024-05-10

Silakan lihat Perubahan penting pada DLAMI

Nama AMI:

  • Driver Nvidia Proprietary Deep Learning AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

  • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

Ditambahkan
  • Rilis awal:

    • Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) seri.

    • Pembelajaran Mendalam OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) seri.

    • Perangkat Lunak Termasuk yang Berikut ini:

      • “nvidia-driver=535.161.08"

      • “pengelola kain = 535.161.08"

      • “cuda = 12.3"

      • “cudnn=8.9.7"

      • “efa=1.32.0"

      • “nccl=2.21.5"

      • “aws-nccl-ofi-plugin= v1.9.1-aws”

  • Menambahkan lingkungan virtual tensorflow (sumber perintah aktivasi/opt/tensorflow/bin/activate). Lingkungan ini meliputi:

    • “tensorflow = 2.16.1"

    • CATATAN

      • Dimulai dengan TF2 .16, tf.estimator API dihapus.

        • Untuk terus menggunakan tf.estimator, Anda harus menggunakan TF 2.15 atau versi sebelumnya. Silakan lihat catatan rilis TensorFlow 2.16.1 untuk informasi lebih lanjut

      • Untuk memastikan kompatibilitas dengan alur kerja pelanggan, kami telah menyematkan versi Keras ke 2.0 menggunakan variabel lingkungan TF_USE_LEGACY_KERAS=1. Jika alur kerja Anda memerlukan penggunaan Keras 3.0, hapus variabel lingkungan ini dari lingkungan TensorFlow virtual /opt/tensorflow Anda menggunakan skrip berikut:

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS