AWS GPU AMI TensorFlow 2.16 con apprendimento approfondito (Amazon Linux 2) - AWS Deep Learning AMIs

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

AWS GPU AMI TensorFlow 2.16 con apprendimento approfondito (Amazon Linux 2)

Per informazioni su come iniziare, consulta. Guida introduttiva a DLAMI

Formato del nome AMI

  • GPU AMI TensorFlow 2.16 con driver Nvidia proprietaria di deep learning (Amazon Linux 2) $ {YYYY-MM-DD}

  • GPU AMI del driver Nvidia con sistema operativo di deep learning TensorFlow 2.16 (Amazon Linux 2) $ {YYYY-MM-DD}

Istanze supportate EC2

  • Consulta la sezione Modifiche importanti a DLAMI.

  • Deep Learning con OSS Il driver Nvidia supporta G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en.

  • Deep Learning con driver Nvidia proprietario supporta G3 (G3.16x non supportato), P3, P3dn

L'AMI include quanto segue:

  • AWS Servizio supportato: EC2

  • Sistema operativo: Amazon Linux 2

  • Architettura di calcolo: x86

  • Python:/3.10 opt/tensorflow/bin/python

  • TensorFlow versione: 2.16

  • Driver NVIDIA:

    • Driver del sistema operativo Nvidia: 550.144.03

    • Driver Nvidia proprietario: 550.144.03

  • CUDA12 Stack NVIDIA:

    • Percorso di installazione di CUDA, NCCL e cuDDN:/-12.2/ usr/local/cuda

  • Programma di installazione EFA: 1.34.0

  • AWS CLI v2 come aws2 e v1 come aws AWS CLI

  • Tipo di volume EBS: gp3

  • Interroga l'AMI-ID con il parametro SSM (la regione di esempio è us-east-1):

    • Driver OSS Nvidia:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • Driver Nvidia proprietario:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • Interroga l'AMI-ID con AWSCLI (la regione di esempio è us-east-1):

    • Driver OSS Nvidia:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • Driver Nvidia proprietario:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

Comunicazione

NVIDIA Container Toolkit 1.17.4

Nella versione 1.17.4 di Container Toolkit, il montaggio delle librerie compatte CUDA è ora disabilitato. Per garantire la compatibilità con più versioni CUDA sui flussi di lavoro dei container, assicurati di aggiornare LD_LIBRARY_PATH per includere le tue librerie di compatibilità CUDA, come mostrato nel tutorial «Se usi un livello di compatibilità CUDA» qui - -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat

Aggiornamenti futuri del sistema operativo TensorFlow

TensorFlow 2.16 sarà l'ultimo DLAMI che utilizza il sistema operativo Ubuntu 20.04. A partire dalla TensorFlow versione 2.17 e successive, DLAMIs inizierà a utilizzare Ubuntu 22.04 come sistema operativo di base. Per i clienti che desiderano effettuare l'aggiornamento a queste nuove versioni, assicurati che i flussi di lavoro siano pronti per questo aggiornamento.

Versione Keras fissata alla 2.0 anziché alla 3.0

Con l'ultima release TF2 1.6, Keras è stato aggiornato dalla versione principale 2 alla versione principale 3.0. Questa versione di Keras è una riscrittura completa del pacchetto Keras (consulta la documentazione di Keras 3 per maggiori informazioni). Per garantire la compatibilità con i flussi di lavoro dei clienti, abbiamo aggiunto le versioni di Keras alla 2.0 utilizzando la variabile di ambiente TF_USE_LEGACY_KERAS=1. Se i tuoi flussi di lavoro richiedono l'utilizzo di Keras 3.0, rimuovi questa variabile di ambiente dal tuo ambiente virtuale /opt/tensorflow utilizzando il seguente script: TensorFlow

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS

Data di rilascio: 2025-02-17

Nomi AMI:

  • GPU TensorFlow 2.16 di Nvidia Driver AMI per il sistema operativo di deep learning (Amazon Linux 2) 20250215

  • GPU AMI TensorFlow 2.16 con driver Nvidia proprietaria di deep learning (Amazon Linux 2) 20250215

Aggiornato
Rimosso

Data di rilascio: 2025-01-20

Nomi AMI:

  • Sistema operativo di deep learning Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250120

  • GPU AMI TensorFlow 2.16 con driver Nvidia proprietaria di deep learning (Amazon Linux 2) 20250118

Aggiornato

Data di rilascio: 2024-10-23

Nomi AMI:

  • Sistema operativo di deep learning Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241022

  • GPU AMI TensorFlow 2.16 con driver Nvidia proprietario di deep learning (Amazon Linux 2) 20241023

Aggiornato

Data di rilascio: 2024-09-28

Nomi AMI:

  • Sistema operativo di deep learning Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

  • GPU AMI TensorFlow 2.16 con driver Nvidia proprietaria di deep learning (Amazon Linux 2) 20240928

Aggiornato

Data di rilascio: 2024-09-21

Nomi AMI:

  • Sistema operativo di deep learning Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

  • GPU AMI TensorFlow 2.16 con driver Nvidia proprietaria di deep learning (Amazon Linux 2) 20240921

Aggiornato
  • Driver Nvidia e Fabric Manager aggiornati dalla versione 535.183.01 a 550.90.07

  • Versione EFA aggiornata da 1.32.0 a 1.34.0

  • Versione aggiornata PyTorch dalla versione 2.3.0 alla 2.3.1

Aggiunto
  • È stato aggiunto il supporto per l' EC2 istanza P5e su OSS Nvidia Driver Images.

Data di rilascio: 2024-08-19

Nomi AMI:

  • Sistema operativo di deep learning Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240817

Aggiunto

Versione 2.16.2 - Data di rilascio: 2024-07-26

Nomi AMI:

  • Sistema operativo di deep learning Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240725

Aggiornato
  • Versione TensorFlow patch aggiornata dalla versione 2.16.1 alla 2.16.2

  • Risolta una versione TensorFlow secondaria errata in DLAMI rilasciata il 17/07/2020

    • La versione Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240717 conteneva inavvertitamente la versione minore 2.17 anziché 2.16. TensorFlow Assicurati che i flussi di lavoro basati sulla versione TensorFlow 2.16 vengano aggiornati alla versione più recente di DLAMI.

Versione 2.16.1 - Data di rilascio: 2024-06-10

Nomi AMI:

  • Sistema operativo di deep learning Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240607

  • GPU AMI TensorFlow 2.16 con driver Nvidia proprietaria di deep learning (Amazon Linux 2) 20240610

Aggiornato
  • Versione del driver Nvidia aggiornata a 535.183.01 da 535.161.08

Data di rilascio: 2024-05-10

Consulta la sezione Modifiche importanti a DLAMI

Nomi AMI:

  • GPU AMI TensorFlow 2.16 con driver Nvidia proprietaria di deep learning (Amazon Linux 2) 20240510

  • Sistema operativo di deep learning Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

Aggiunto
  • Versione iniziale di:

    • Serie GPU TensorFlow 2.16 (Amazon Linux 2) proprietaria di Deep Learning per driver Nvidia.

    • GPU AMI Nvidia OSS serie Deep Learning OSS TensorFlow 2.16 (Amazon Linux 2).

    • Il software include quanto segue:

      • «nvidia-driver=535.161.08"

      • «fabric-manager=535.161.08"

      • «cuda=12,3"

      • «cudn=8.9.7"

      • «efa=1,32.0"

      • «nccl=2.21,5"

      • «aws-nccl-ofi-plugin=v1.9.1-aws»

  • Aggiunto l'ambiente virtuale tensorflow (fonte del comando di attivazione/). opt/tensorflow/bin/activate Questo ambiente include quanto segue:

    • «tensorflow=2.16.1"

    • NOTA

      • A partire da TF2 .16, l'API tf.estimator viene rimossa.

        • Per continuare a utilizzare tf.estimator, dovrai utilizzare TF 2.15 o una versione precedente. Per ulteriori informazioni, consulta le note di rilascio della versione TensorFlow 2.16.1

      • Per garantire la compatibilità con i flussi di lavoro dei clienti, abbiamo aggiunto le versioni di Keras alla 2.0 utilizzando la variabile di ambiente TF_USE_LEGACY_KERAS=1. Se i tuoi flussi di lavoro richiedono l'utilizzo di Keras 3.0, rimuovi questa variabile di ambiente dal tuo ambiente virtuale /opt/tensorflow utilizzando il seguente script: TensorFlow

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS