AWS AMI di apprendimento approfondito (Amazon Linux 2) - AWS Deep Learning AMIs

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

AWS AMI di apprendimento approfondito (Amazon Linux 2)

Per informazioni su come iniziare, consultaGuida introduttiva a DLAMI.

Formato del nome AMI

  • Versione AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) $ {XX.X}

  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) Versione $ {XX.X}

Istanze supportate EC2

  • Consulta la sezione Modifiche importanti a DLAMI.

  • Deep Learning con OSS Il driver Nvidia supporta G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5

  • Deep Learning con driver Nvidia proprietario supporta G3 (G3.16x non supportato), P3, P3dn

L'AMI include quanto segue:

  • AWS Servizio supportato: Amazon EC2

  • Sistema operativo: Amazon Linux 2

  • Architettura di calcolo: x86

  • Framework per ambienti Conda e versioni python:

    • AMI driver Nvidia OSS con apprendimento approfondito (Amazon Linux 2):

      • python3: Python 3.10

      • tensorflow2_p310:2.16, Python 3.10 TensorFlow

      • pytorch_p310:2.2, Python 3.10 PyTorch

    • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2):

      • python3: Python 3.10

      • tensorflow2_p310:2.16, Python 3.10 TensorFlow

      • pytorch_p310:2.2, Python 3.10 PyTorch

  • Driver NVIDIA:

    • Driver Nvidia per sistema operativo: 550.163.01

    • Driver Nvidia proprietario: 550.163.01

  • Stack CUDA12 NVIDIA 1.1-12.4:

    • Percorso di installazione di CUDA, NCCL e cuDDN:/-xx.x/ usr/local/cuda

    • CUDA predefinito: 12.1

      • PATH//usr/local/cudapunta a 1. CUDA12

      • Aggiornato di seguito le variabili di ambiente:

        • LD_LIBRARY_PATH da avere/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1:/usr/local/cuda-12.1/targets/x86_64-linux/lib

        • PERCORSO da avere//usr/local/cuda-12.1/bin/:/usr/local/cuda-11.8/include

      • Per qualsiasi versione CUDA diversa, aggiorna LD_LIBRARY_PATH di conseguenza.

    • Versione NCCL compilata per CUDA 12.1-12.4:2.22.3

    • Luogo dei test NCCL:

      • all_reduce, all_gather e reduce_scatter:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test

      • Per eseguire i test NCCL, è necessario che LD_LIBRARY_PATH abbia superato gli aggiornamenti seguenti.

        • I comuni sono già stati aggiunti a LD_LIBRARY_PATH: PATHs

          • /opt/amazon/efa/lib:/opt/amazon/openmpi/lib:/opt/aws-ofi-nccl/lib:/usr/local/lib:/usr/lib

        • Per qualsiasi versione CUDA diversa, aggiorna LD_LIBRARY_PATH di conseguenza.

  • Programma di installazione EFA: 1.38.0

  • GDRCopy: 2.4

  • AWS OFI NCCL: 1.13.2

    • Ubicazione del sistema:/usr/local/cuda-xx.x/efa

    • Questo viene aggiunto per eseguire i test NCCL che si trovano in/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test

    • Inoltre, il PyTorch pacchetto include anche il plug-in AWS OFI NCCL collegato dinamicamente come pacchetto conda e utilizzerà quel pacchetto aws-ofi-nccl-dlc al posto del sistema OFI NCCL. PyTorch AWS

  • Posizione dei usr/local/cuda-xx.x/efa/test test NCCL:/-cuda-xx.x/

  • AWS CLI v2 ausr/local/bin/aws/2 AWS CLI e v1 a/usr/local/bin/aws

  • Tipo di volume EBS: gp3

  • Interroga l'AMI-ID con il parametro SSM (la regione di esempio è us-east-1):

    • Driver OSS Nvidia:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/multi-framework-oss-nvidia-driver-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • Driver Nvidia proprietario:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/multi-framework-proprietary-nvidia-driver-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • Interroga l'AMI-ID con AWSCLI (la regione di esempio è us-east-1):

    • Driver OSS Nvidia:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • Driver Nvidia proprietario:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

Note

Aggiornamenti EFA dalla 1.37 alla 1.38 (versione il 05/02/25)

  • EFA ora include il plugin OFI NCCL, che ora può essere trovato in/ AWS -ofi-nccl/. opt/amazon/ofi-nccl rather than the original /opt/aws Se aggiorni la variabile LD_LIBRARY_PATH, assicurati di modificare correttamente la posizione OFI NCCL.

Rimozione dell'ambiente Neuron Conda

  • Il driver Nvidia proprietario di Deep Learning AMIs rilasciato dopo il 18 luglio 2024 verrà fornito senza gli ambienti Neuron Conda per e. PyTorch TensorFlow Utilizza invece DLAMIs Neuron nelle note di rilascio di DLAMI per utilizzare ambienti neuronali.

Rimozione di Audit Package

  • I DLAMI rilasciati tra il 26 marzo 2024 (2024-03-26) e il 12 aprile 2024 (2024-04-12) sono stati spediti senza il pacchetto di audit. Se hai bisogno di questo pacchetto specifico per le tue esigenze di registrazione e monitoraggio, migra i flussi di lavoro al DLAMI più recente per utilizzare quelli con il pacchetto di audit installato.

Horovod

Data di rilascio: 2025-04-22

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 81.2

  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 81.2

Aggiornato

Data di rilascio: 2025-02-17

Nomi AMI
  • AMI driver Nvidia OSS con apprendimento approfondito (Amazon Linux 2) versione 80.6

  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 80.4

Aggiornato

Rimosso

Data di rilascio: 2025-02-05

Nomi AMI
  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 80.2

  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 80.4

Aggiornato

  • Versione EFA aggiornata da 1.37.0 a 1.38.0

    • EFA ora include il plugin AWS OFI NCCL, che ora può essere trovato in/-ofi-nccl/. opt/amazon/ofi-nccl rather than the original /opt/aws Se aggiorni la variabile LD_LIBRARY_PATH, assicurati di modificare correttamente la posizione OFI NCCL.

Data di rilascio: 2025-01-15

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 80.3

  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 80.1

Aggiornato

Data di rilascio: 2024-12-09

Nomi AMI
  • AMI driver Nvidia OSS con apprendimento approfondito (Amazon Linux 2) versione 80.1

  • AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 79.9

Aggiornato

  • Nvidia Container Toolkit aggiornato dalla versione 1.17.0 alla 1.17.3

Data di rilascio: 2024-11-11

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 79.9

  • AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 79.7

Aggiornato

Data di rilascio: 2024-10-22

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 79.6

  • AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 79.6

Aggiornato

Data di rilascio: 2024-10-03

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 79.3

  • AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 79.3

Aggiornato

Data di rilascio: 2024-07-18

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 78.6

  • AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 78.7

Aggiornato

  • Sono stati rimossi gli ambienti conda aws_neuron_pytorch_p38 e aws_neuron_tensorflow_p38 dall'AMI Nvidia Driver proprietaria di Deep Learning.

  • È stato rimosso il supporto per la famiglia di istanze Inf1 dall'AMI Nvidia Driver proprietaria di Deep Learning.

Data di rilascio: 2024-06-06

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 78.5

  • AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 78.5

Aggiornato

  • Versione del driver Nvidia aggiornata a 535.183.01 da 535.161.08

Data di rilascio: 2024-05-17

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 78.1

  • AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 78.1

Aggiornato

Data di rilascio: 2024-05-07

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 78.0

  • AMI del driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 78.0

Aggiornato

Aggiunto

  • Aggiunto lo stack CUDA12 .3 con CUDA12 .3, NCCL 2.21.5, cuDNN 8.9.7

Rimosso

Data di rilascio: 2024-04-04

Nomi AMI
  • Sistema operativo di deep learning Nvidia Driver AMI (Amazon Linux 2) versione 77.0

  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 77.0

Aggiornato

  • PyTorch versione aggiornata dalla 2.1 alla 2.2 nell'ambiente pytorch_p310.

  • Per il driver OSS Nvidia DLAMIs, è stato aggiunto il supporto per le istanze G6 e Gr6. EC2 Per ulteriori informazioni, consulta la pagina di selezione delle EC2 istanze.

Data di rilascio: 2024-03-29

Nomi AMI
  • AMI driver Nvidia OSS con apprendimento approfondito (Amazon Linux 2) versione 76.8

  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 76.9

Aggiornato

  • Driver Nvidia aggiornato da 535.104.12 a 535.161.08 sia nel driver Nvidia proprietario che in quello OSS. DLAMIs

  • Le nuove istanze supportate per ogni DLAMI sono le seguenti:

    • Deep Learning con driver Nvidia proprietario supporta G3 (G3.16x non supportato), P3, P3dn, Inf1

    • Deep Learning con OSS Il driver Nvidia supporta G4dn, G5, P4d, P4de.

Rimosso

  • Rimosso il EC2 supporto per le istanze G4dn, G5, G3.16x dal driver proprietario Nvidia DLAMI.

Versione 76.8

Data di rilascio: 2024-03-20

Nomi AMI
  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 76.8

Aggiunto

  • Aggiunto awscliv2 nell'AMI come usr/local/bin/aws2, alongside awscliv1 as /usr/local/bin/aws /su Nvidia Driver AMI proprietario

Versione 76.7

Data di rilascio: 2024-03-20

Nomi AMI
  • AMI driver Nvidia OSS con apprendimento approfondito (Amazon Linux 2) versione 76.7

Aggiunto

  • Aggiunto awscliv2 nell'AMI come usr/local/bin/aws2, alongside awscliv1 as /usr/local/bin/aws /on OSS Nvidia Driver AMI

  • Driver OSS Nvidia DLAMI aggiornato con supporto G4dn e G5, in base al quale il supporto attuale è il seguente:

    • L'AMI driver Nvidia proprietaria di Deep Learning Base (Amazon Linux 2) supporta P3, P3dn, G3, G5, G4dn.

    • L'AMI driver Nvidia OSS di Deep Learning Base (Amazon Linux 2) supporta G4dn, G5, P4, P5.

  • Si consiglia di utilizzare i driver DLAMIs OSS Nvidia per G4dn, G5, P4, P5.

Versione 76.3

Data di rilascio: 2024-02-14

Aggiornato

  • Aggiornato TensorFlow da 2.13.0 a 2.15.0

  • EFA aggiornato dalla versione 1.29.0 alla 1.30.0

  • -OFI-NCCL aggiornato AWS da 1.7.3-aws a 1.7.4-aws

  • Driver Nvidia aggiornato a 535.104.12 sull'AMI driver Nvidia proprietaria di Deep Learning

  • Driver Nvidia aggiornato a 535.154.05 su Deep Learning OSS Nvidia Driver AMI

Versione 76.2

Data di rilascio: 2024-02-02

Nomi AMI
  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 76.2

  • AMI driver Nvidia OSS con apprendimento approfondito (Amazon Linux 2) versione 76.4

Sicurezza

Versione 76.1

Data di rilascio: 2023-12-27

Aggiornato

  • Aggiornato PyTorch da 2.0.1 a 2.1.0

Versione 75.1

Data di rilascio: 2023-11-17

Consulta la sezione Modifiche importanti a DLAMI

Nomi AMI
  • AMI driver Nvidia OSS con apprendimento approfondito (Amazon Linux 2) versione 75.1

  • AMI driver Nvidia proprietaria di deep learning (Amazon Linux 2) versione 75.1

Aggiunto

  • AWS Deep Learning AMI (DLAMI) è suddiviso in due gruppi distinti:

    • DLAMI che utilizza il driver proprietario Nvidia (per supportare P3, P3dn, G3, G5, G4dn).

    • DLAMI che utilizza il driver Nvidia OSS per abilitare EFA (per supportare P4, P5).

  • Per ulteriori informazioni sulla divisione DLAMI, fare riferimento all'annuncio pubblico.

  • AWS le query cli di cui sopra si trovano nelle note di rilascio sotto il punto bullet Query AMI-ID with ( AWSCLI la regione di esempio è us-east-1)

Aggiornato

  • EFA aggiornato dalla versione 1.26.1 alla versione 1.29.0

  • GDRCopy aggiornato dalla versione 2.3 alla 2.4

Versione 74.4

Data di rilascio: 2023-10-27

Aggiornato

  • AWS Plugin OFI NCCL aggiornato dalla versione 1.7.2 alla versione 1.7.3

  • Directory CUDA 12.0-12.1 aggiornate con la versione NCCL 2.18.5

  • CUDA12.1 aggiornata come versione CUDA predefinita

    • LD_LIBRARY_PATH aggiornato per avere//usr/local/cuda-12.1/targets/x86_64-linux/lib/:/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1 and PATH to have /usr/local/cuda-12.1/bin

    • Per i clienti che desiderano passare a una versione CUDA diversa, definisci le variabili LD_LIBRARY_PATH e PATH di conseguenza.

  • Pillow aggiornato dalla versione 9.4.0 alla 10.1.0 per correggere SNYK-PYTHON-PILLOW-5918878 in tutti gli ambienti conda

  • Opencv-python aggiornato da 4.8.0.74 a 4.8.1.78 per correggere SNYK-PYTHON-OPENCVPYTHON-5926695 in tutti gli ambienti conda

Aggiunto

Versione 74.0

Data di rilascio: 2023-07-19

Aggiornato

  • Aggiornato TensorFlow dalla 2.12 alla 2.13

    • Horovod è stato rimosso dall'ambiente conda in questa versione. Vedi Avviso per i dettagli sull'installazione di horovod.

Versione 73.1

Data di rilascio: 2023-06-12

Aggiornato

  • Aggiornato PyTorch dalla 2.0.0 alla 2.0.1