AWS AMI de aprendizaje profundo (Amazon Linux 2) - AWS Deep Learning AMIs

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

AWS AMI de aprendizaje profundo (Amazon Linux 2)

Si necesita ayuda para empezar, consulteIntroducción a las DLAMI.

Formato de nombre AMI

  • Controlador Nvidia (Amazon Linux 2) patentado por Deep Learning, versión $ {XX.X}

  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión $ {XX.X}

Instancias compatibles EC2

  • Consulte Cambios importantes en la DLAMI.

  • Aprendizaje profundo con OSS El controlador Nvidia es compatible con G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5

  • El aprendizaje profundo con el controlador patentado de Nvidia es compatible con G3 (no es compatible con G3.16x), P3, P3dn

La AMI incluye lo siguiente:

  • AWS Servicio compatible: Amazon EC2

  • Sistema operativo: Amazon Linux 2

  • Arquitectura de cómputo: x86

  • Versiones del marco de entornos Conda y de Python:

    • AMI del controlador Nvidia OSS de aprendizaje profundo (Amazon Linux 2):

      • python3: Python 3.10

      • tensorflow2_p310:2.16, Python 3.10 TensorFlow

      • pytorch_p310:2.2, Python 3.10 PyTorch

    • AMI del controlador Nvidia patentado por Deep Learning (Amazon Linux 2):

      • python3: Python 3.10

      • tensorflow2_p310:2.16, Python 3.10 TensorFlow

      • pytorch_p310:2.2, Python 3.10 PyTorch

  • Controlador NVIDIA:

    • Controlador OSS Nvidia: 550.163.01

    • Controlador Nvidia patentado: 550.163.01

  • Pila NVIDIA 1.-12.4: CUDA12

    • Ruta de instalación de CUDA, NCCL y cuDDN:/-xx.x/ usr/local/cuda

    • CUDA predeterminado: 12.1

      • PATH/usr/local/cudaapunta a 1. CUDA12

      • Se actualizaron las siguientes variables de entorno:

        • LD_LIBRARY_PATH tendrá/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1:/usr/local/cuda-12.1/targets/x86_64-linux/lib

        • PATH para tener//usr/local/cuda-12.1/bin/:/usr/local/cuda-11.8/include

      • Para cualquier versión de CUDA diferente, actualice LD_LIBRARY_PATH en consecuencia.

    • Versión NCCL compilada para CUDA 12.1-12.4:2.22.3

    • Ubicación de las pruebas de NCCL:

      • all_reduce, all_gather y reduce_scatter:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test

      • Para ejecutar las pruebas de la NCCL, LD_LIBRARY_PATH debe pasar las siguientes actualizaciones.

        • Las más comunes ya están añadidas a LD_LIBRARY_PATH: PATHs

          • /opt/amazon/efa/lib:/opt/amazon/openmpi/lib:/opt/aws-ofi-nccl/lib:/usr/local/lib:/usr/lib

        • Para cualquier versión de CUDA diferente, actualice LD_LIBRARY_PATH en consecuencia.

  • Instalador de EFA: 1.38.0

  • GDRCopy: 2.4

  • AWS OFI NCCL: 1.13.2

    • Ubicación del sistema:/usr/local/cuda-xx.x/efa

    • Esto se agrega para ejecutar las pruebas de la NCCL ubicadas en/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test

    • Además, el PyTorch paquete viene con el complemento AWS OFI NCCL vinculado dinámicamente como paquete conda y PyTorch utilizará ese aws-ofi-nccl-dlc paquete en lugar del OFI NCCL del sistema. AWS

  • Lugar de las pruebas de la NCCL:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test

  • AWS CLI v2 en/2 y v1 en/usr/local/bin/aws AWS CLI usr/local/bin/aws

  • Tipo de volumen de EBS: gp3

  • Consulte el AMI-ID con el parámetro SSM (la región de ejemplo es us-east-1):

    • Controlador OSS Nvidia:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/multi-framework-oss-nvidia-driver-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • Controlador Nvidia patentado:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/multi-framework-proprietary-nvidia-driver-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • Consulta el AMI-ID con AWSCLI (la región de ejemplo es us-east-1):

    • Controlador OSS Nvidia:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • Controlador Nvidia patentado:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

​Avisos

Actualizaciones de la EFA de la 1.37 a la 1.38 (publicada el 5 de febrero de 2020)

  • EFA ahora incluye el complemento AWS OFI NCCL, que ahora se encuentra en/-ofi-nccl/. opt/amazon/ofi-nccl rather than the original /opt/aws Si va a actualizar la variable LD_LIBRARY_PATH, asegúrese de modificar correctamente la ubicación de su OFI NCCL.

Eliminación del entorno Neuron Conda

  • El controlador Nvidia patentado por Deep Learning AMIs lanzado después del 18 de julio de 2024 se enviará sin los entornos Neuron Conda para y. PyTorch TensorFlow En su lugar, utilice Neuron DLAMIs en las notas de publicación de DLAMI para utilizar entornos neuronales.

Eliminación de Audit Package

  • Los DLAMI publicados entre el 26 de marzo de 2024 (26 de marzo de 2024) y el 12 de abril de 2024 (12 de abril de 2024) se enviaron sin el paquete de auditoría. Si necesita este paquete específico para sus necesidades de registro y supervisión, migre sus flujos de trabajo a la última DLAMI para consumir aquellos con el paquete de auditoría instalado.

Horovod

Fecha de lanzamiento: 22 de abril de 2020

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 81.2

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 81.2

Actualizado

  • Se actualizó el controlador Nvidia de la versión 550.144.03 a la 550.163.01 para adaptarlo a lo indicado en el boletín de seguridad del controlador de pantalla de CVEs GPU de NVIDIA de abril de 2025

Fecha de lanzamiento: 17 de febrero de 2021

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 80.6

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 80.4

Actualizado

Eliminaciones

Fecha de lanzamiento: 05 de febrero de 2020

Nombres AMI
  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 80.2

  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 80.4

Actualizado

  • Se actualizó la versión EFA de 1.37.0 a 1.38.0

    • EFA ahora incluye el complemento AWS OFI NCCL, que ahora se encuentra en/-ofi-nccl/. opt/amazon/ofi-nccl rather than the original /opt/aws Si va a actualizar la variable LD_LIBRARY_PATH, asegúrese de modificar correctamente la ubicación de su OFI NCCL.

Fecha de lanzamiento: 15 de enero de 2020

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 80.3

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 80.1

Actualizado

  • Se actualizó el controlador Nvidia de la versión 550.127.05 a la 550.144.03 para adaptarlo a lo indicado en el boletín de seguridad del controlador de CVEs pantalla de GPU de NVIDIA de enero de 2025

Fecha de lanzamiento: 9 de diciembre de 2020

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 80.1

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 79.9

Actualizado

  • Se actualizó el kit de herramientas Nvidia Container de la versión 1.17.0 a la 1.17.3

Fecha de lanzamiento: 11/11/2022

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 79.9

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 79.7

Actualizado

Fecha de lanzamiento: 22-10-2022

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 79.6

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 79.6

Actualizado

  • Se actualizó el controlador de Nvidia de la versión 550.90.07 a la 550.127.05 para adaptarlo a lo indicado en el boletín de seguridad de las pantallas de CVEs GPU de NVIDIA de octubre de 2024

Fecha de lanzamiento: 3 de octubre de 2024

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 79.3

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 79.3

Actualizado

Fecha de lanzamiento: 18-07-2020

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 78.6

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 78.7

Actualizado

  • Se eliminaron los entornos conda aws_neuron_pytorch_p38 y aws_neuron_tensorflow_p38 de la AMI del controlador Nvidia patentado por Deep Learning.

  • Se eliminó la compatibilidad con la familia de instancias Inf1 en la AMI del controlador Nvidia propietario de Deep Learning.

Fecha de lanzamiento: 6 de junio de 2020

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 78.5

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 78.5

Actualizado

  • Se actualizó la versión del controlador Nvidia a 535.183.01 desde 535.161.08

Fecha de lanzamiento: 17 de mayo de 2020

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 78.1

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 78.1

Actualizado

Fecha de lanzamiento: 2024-05-07

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 78.0

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 78.0

Actualizado

Added

  • Se agregó una pila CUDA12 3.3 con CUDA12 0.3, NCCL 2.21.5, CuDNN 8.97.

Eliminaciones

Fecha de lanzamiento: 4 de abril de 2020

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 77.0

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 77.0

Actualizado

  • PyTorch versión actualizada de 2.1 a 2.2 en el entorno pytorch_p310.

  • Para el controlador OSS Nvidia, se agregó compatibilidad con las instancias G6 DLAMIs y Gr6. EC2 Consulte la página de selección de EC2 instancias para obtener más información.

Fecha de lanzamiento: 29 de marzo de 2020

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 76.8

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 76.9

Actualizado

  • Se actualizó el controlador Nvidia de 535.104.12 a 535.161.08 tanto en el controlador Nvidia propietario como en el controlador OSS. DLAMIs

  • Las nuevas instancias compatibles para cada DLAMI son las siguientes:

    • El aprendizaje profundo con el controlador patentado de Nvidia es compatible con G3 (no se admite G3.16x), P3, P3dn e Inf1

    • Aprendizaje profundo con OSS El controlador Nvidia es compatible con G4dn, G5, P4d, P4de.

Eliminaciones

  • Se eliminó la compatibilidad con las EC2 instancias G4dn, G5 y G3.16x del controlador DLAMI patentado de Nvidia.

Versión 76.8

Fecha de lanzamiento: 2024-03-20

Nombres AMI
  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 76.8

Added

  • Se agregó awscliv2 en la AMI como/usr/local/bin/aws2, alongside awscliv1 as /usr/local/bin/awsen la AMI del controlador propietario de Nvidia

Versión 76.7

Fecha de lanzamiento: 2024-03-20

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 76.7

Added

  • Se agregó awscliv2 en la AMI como/usr/local/bin/aws2, alongside awscliv1 as /usr/local/bin/awsen la AMI del controlador Nvidia OSS

  • El controlador OSS Nvidia DLAMI actualizado con soporte para G4dn y G5, según su soporte actual, se ve a continuación:

    • El controlador Nvidia AMI (Amazon Linux 2) patentado por Deep Learning Base es compatible con P3, P3dn, G3, G5 y G4dn.

    • El controlador Nvidia AMI de Deep Learning Base OSS (Amazon Linux 2) es compatible con G4dn, G5, P4 y P5.

  • Se recomienda utilizar el controlador DLAMIs OSS Nvidia para G4dn, G5, P4, P5.

Versión 7.6.3

Fecha de lanzamiento: 14/02/2020

Actualizado

  • Actualizado TensorFlow de la 2.13.0 a la 2.15.0

  • Se actualizó la EFA de la 1.29.0 a la 1.30.0

  • Se ha actualizado AWS el -OFI-NCCL de la 1.7.3-aws a la 1.7.4-aws

  • Se actualizó el controlador Nvidia a 535.104.12 en la AMI del controlador Nvidia patentado por Deep Learning

  • Se actualizó el controlador Nvidia a 535.154.05 en la AMI del controlador Nvidia OSS de aprendizaje profundo

Versión 76.2

Fecha de lanzamiento: 2024-02-02

Nombres AMI
  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 76.2

  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 76.4

Seguridad

Versión 7.6.1

Fecha de lanzamiento: 27-12-2020

Actualizado

  • Actualizado PyTorch de la 2.0.1 a la 2.1.0

Versión 75.1

Fecha de lanzamiento: 17-11-2020

Consulte Cambios importantes en la DLAMI

Nombres AMI
  • Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 75.1

  • Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 75.1

Added

  • AWS La AMI de aprendizaje profundo (DLAMI) se divide en dos grupos separados:

    • DLAMI que utiliza el controlador propietario de Nvidia (compatible con P3, P3dn, G3, G5, G4dn).

    • DLAMI que usa el controlador OSS de Nvidia para habilitar EFA (para admitir P4, P5).

  • Consulte el anuncio público para obtener más información sobre la división de DLAMI.

  • AWS Las consultas cli anteriores se encuentran en las notas de la versión, debajo del identificador AMI-ID de consulta con viñetas AWSCLI (la región de ejemplo es us-east-1)

Actualizado

  • La EFA se actualizó de la versión 1.26.1 a la 1.29.0

  • GDRCopy actualizado de 2.3 a 2.4

Versión 74.4

Fecha de lanzamiento: 2023-10-27

Actualizado

Added

Versión 74.0

Fecha de lanzamiento: 2023-07-19

Actualizado

  • Actualizado TensorFlow de la 2.12 a la 2.13

    • En esta versión, Horovod se ha eliminado del entorno de conda. Consulte el Aviso para obtener más información sobre la instalación de horovod.

Versión 73.1

Fecha de lanzamiento: 12/06/2020

Actualizado

  • Actualizado PyTorch de la 2.0.0 a la 2.0.1