Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
AWS AMI de aprendizaje profundo (Amazon Linux 2)
Si necesita ayuda para empezar, consulteIntroducción a las DLAMI.
Formato de nombre AMI
Controlador Nvidia (Amazon Linux 2) patentado por Deep Learning, versión $ {XX.X}
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión $ {XX.X}
Instancias compatibles EC2
Consulte Cambios importantes en la DLAMI.
Aprendizaje profundo con OSS El controlador Nvidia es compatible con G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5
El aprendizaje profundo con el controlador patentado de Nvidia es compatible con G3 (no es compatible con G3.16x), P3, P3dn
La AMI incluye lo siguiente:
AWS Servicio compatible: Amazon EC2
Sistema operativo: Amazon Linux 2
Arquitectura de cómputo: x86
Versiones del marco de entornos Conda y de Python:
AMI del controlador Nvidia OSS de aprendizaje profundo (Amazon Linux 2):
python3: Python 3.10
tensorflow2_p310:2.16, Python 3.10 TensorFlow
pytorch_p310:2.2, Python 3.10 PyTorch
AMI del controlador Nvidia patentado por Deep Learning (Amazon Linux 2):
python3: Python 3.10
tensorflow2_p310:2.16, Python 3.10 TensorFlow
pytorch_p310:2.2, Python 3.10 PyTorch
Controlador NVIDIA:
Controlador OSS Nvidia: 550.163.01
Controlador Nvidia patentado: 550.163.01
Pila NVIDIA 1.-12.4: CUDA12
Ruta de instalación de CUDA, NCCL y cuDDN:/-xx.x/ usr/local/cuda
-
CUDA predeterminado: 12.1
PATH/usr/local/cudaapunta a 1. CUDA12
Se actualizaron las siguientes variables de entorno:
LD_LIBRARY_PATH tendrá/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1:/usr/local/cuda-12.1/targets/x86_64-linux/lib
PATH para tener//usr/local/cuda-12.1/bin/:/usr/local/cuda-11.8/include
Para cualquier versión de CUDA diferente, actualice LD_LIBRARY_PATH en consecuencia.
Versión NCCL compilada para CUDA 12.1-12.4:2.22.3
Ubicación de las pruebas de NCCL:
all_reduce, all_gather y reduce_scatter:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test
Para ejecutar las pruebas de la NCCL, LD_LIBRARY_PATH debe pasar las siguientes actualizaciones.
Las más comunes ya están añadidas a LD_LIBRARY_PATH: PATHs
/opt/amazon/efa/lib:/opt/amazon/openmpi/lib:/opt/aws-ofi-nccl/lib:/usr/local/lib:/usr/lib
Para cualquier versión de CUDA diferente, actualice LD_LIBRARY_PATH en consecuencia.
Instalador de EFA: 1.38.0
GDRCopy: 2.4
AWS OFI NCCL: 1.13.2
Ubicación del sistema:/usr/local/cuda-xx.x/efa
Esto se agrega para ejecutar las pruebas de la NCCL ubicadas en/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test
Además, el PyTorch paquete viene con el complemento AWS OFI NCCL vinculado dinámicamente como paquete conda y PyTorch utilizará ese aws-ofi-nccl-dlc paquete en lugar del OFI NCCL del sistema. AWS
Lugar de las pruebas de la NCCL:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test
AWS CLI v2 en/2 y v1 en/usr/local/bin/aws AWS CLI usr/local/bin/aws
Tipo de volumen de EBS: gp3
Consulte el AMI-ID con el parámetro SSM (la región de ejemplo es us-east-1):
Controlador OSS Nvidia:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/multi-framework-oss-nvidia-driver-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
Controlador Nvidia patentado:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/multi-framework-proprietary-nvidia-driver-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
Consulta el AMI-ID con AWSCLI (la región de ejemplo es us-east-1):
Controlador OSS Nvidia:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
Controlador Nvidia patentado:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
Avisos
Actualizaciones de la EFA de la 1.37 a la 1.38 (publicada el 5 de febrero de 2020)
-
EFA ahora incluye el complemento AWS OFI NCCL, que ahora se encuentra en/-ofi-nccl/. opt/amazon/ofi-nccl rather than the original /opt/aws Si va a actualizar la variable LD_LIBRARY_PATH, asegúrese de modificar correctamente la ubicación de su OFI NCCL.
Eliminación del entorno Neuron Conda
-
El controlador Nvidia patentado por Deep Learning AMIs lanzado después del 18 de julio de 2024 se enviará sin los entornos Neuron Conda para y. PyTorch TensorFlow En su lugar, utilice Neuron DLAMIs en las notas de publicación de DLAMI para utilizar entornos neuronales.
Eliminación de Audit Package
-
Los DLAMI publicados entre el 26 de marzo de 2024 (26 de marzo de 2024) y el 12 de abril de 2024 (12 de abril de 2024) se enviaron sin el paquete de auditoría. Si necesita este paquete específico para sus necesidades de registro y supervisión, migre sus flujos de trabajo a la última DLAMI para consumir aquellos con el paquete de auditoría instalado.
Horovod
-
Horovod se elimina de los entornos conda pytorch_p310 y tensorflow2_p310 actuales en la DLAMI. Los clientes podrán instalar las bibliotecas de Horovod siguiendo las directrices de Horovod e instalarlas en las suyas para sus tareas de formación distribuidas.
DLAMIs
Fecha de lanzamiento: 22 de abril de 2020
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 81.2
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 81.2
Actualizado
Se actualizó el controlador Nvidia de la versión 550.144.03 a la 550.163.01 para adaptarlo a lo indicado en el boletín de seguridad del controlador de pantalla de CVEs GPU de NVIDIA de abril de 2025
Fecha de lanzamiento: 17 de febrero de 2021
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 80.6
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 80.4
Actualizado
-
Se actualizó el kit de herramientas NVIDIA Container de la versión 1.17.3 a la versión 1.17.4
En la versión 1.17.4 del Container Toolkit, el montaje de bibliotecas compatibles con CUDA ahora está deshabilitado. Para garantizar la compatibilidad con varias versiones de CUDA en los flujos de trabajo de contenedores, asegúrate de actualizar tu LD_LIBRARY_PATH para incluir tus bibliotecas de compatibilidad con CUDA, tal y como se muestra en el tutorial «Si utilizas una capa de compatibilidad con CUDA», aquí: -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat
Eliminaciones
Se eliminaron las bibliotecas de espacio de usuario cuobj y nvdisasm proporcionadas por el kit de herramientas NVIDIA CUDA
para abordar el CVEs tema presente en el boletín de seguridad del kit de herramientas NVIDIA CUDA del 18 de febrero de 2025
Fecha de lanzamiento: 05 de febrero de 2020
Nombres AMI
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 80.2
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 80.4
Actualizado
-
Se actualizó la versión EFA de 1.37.0 a 1.38.0
EFA ahora incluye el complemento AWS OFI NCCL, que ahora se encuentra en/-ofi-nccl/. opt/amazon/ofi-nccl rather than the original /opt/aws Si va a actualizar la variable LD_LIBRARY_PATH, asegúrese de modificar correctamente la ubicación de su OFI NCCL.
Fecha de lanzamiento: 15 de enero de 2020
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 80.3
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 80.1
Actualizado
Se actualizó el controlador Nvidia de la versión 550.127.05 a la 550.144.03 para adaptarlo a lo indicado en el boletín de seguridad del controlador de CVEs pantalla de GPU de NVIDIA
de enero de 2025
Fecha de lanzamiento: 9 de diciembre de 2020
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 80.1
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 79.9
Actualizado
Se actualizó el kit de herramientas Nvidia Container de la versión 1.17.0 a la 1.17.3
Fecha de lanzamiento: 11/11/2022
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 79.9
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 79.7
Actualizado
Fecha de lanzamiento: 22-10-2022
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 79.6
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 79.6
Actualizado
Se actualizó el controlador de Nvidia de la versión 550.90.07 a la 550.127.05 para adaptarlo a lo indicado en el boletín de seguridad de las pantallas de CVEs GPU de NVIDIA de octubre de 2024
Fecha de lanzamiento: 3 de octubre de 2024
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 79.3
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 79.3
Actualizado
Fecha de lanzamiento: 18-07-2020
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 78.6
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 78.7
Actualizado
Se eliminaron los entornos conda aws_neuron_pytorch_p38 y aws_neuron_tensorflow_p38 de la AMI del controlador Nvidia patentado por Deep Learning.
Se eliminó la compatibilidad con la familia de instancias Inf1 en la AMI del controlador Nvidia propietario de Deep Learning.
Fecha de lanzamiento: 6 de junio de 2020
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 78.5
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 78.5
Actualizado
Se actualizó la versión del controlador Nvidia a 535.183.01 desde 535.161.08
Fecha de lanzamiento: 17 de mayo de 2020
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 78.1
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 78.1
Actualizado
Se actualizó torchserve
de la v0.8.2 a la v0.11.0 en el entorno pytorch_p310 .
Fecha de lanzamiento: 2024-05-07
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 78.0
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 78.0
Actualizado
TensorFlow versión actualizada de la 2.15 a la 2.16 en el entorno tensorflow2_p310.
Se actualizó la versión EFA de la versión 1.30 a la versión 1.32
Se actualizó el complemento AWS OFI NCCL de la versión 1.7.4 a la versión 1.9.1
-
NOTA: La versión 1.15.0 NO incluye los paquetes ni nvidia-docker2. nvidia-container-runtime Se recomienda utilizar los nvidia-container-toolkit paquetes directamente siguiendo la documentación del kit de herramientas de contenedores de Nvidia.
Added
Se agregó una pila CUDA12 3.3 con CUDA12 0.3, NCCL 2.21.5, CuDNN 8.97.
Eliminaciones
Se eliminaron CUDA11 las pilas de 0,7 y 2,0 presentes en/-12,0 CUDA12 usr/local/cuda-11.7 and /usr/local/cuda
Se eliminaron el paquete nvidia-docker2 y su comando nvidia-docker como parte de la actualización del kit de herramientas de contenedores de Nvidia de la 1.13.5 a la 1.15.0, que NO incluye los paquetes ni nvidia-docker2.
nvidia-container-runtime
Fecha de lanzamiento: 4 de abril de 2020
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 77.0
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 77.0
Actualizado
PyTorch versión actualizada de 2.1 a 2.2 en el entorno pytorch_p310.
Para el controlador OSS Nvidia, se agregó compatibilidad con las instancias G6 DLAMIs y Gr6. EC2 Consulte la página de selección de EC2 instancias para obtener más información.
Fecha de lanzamiento: 29 de marzo de 2020
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 76.8
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 76.9
Actualizado
Se actualizó el controlador Nvidia de 535.104.12 a 535.161.08 tanto en el controlador Nvidia propietario como en el controlador OSS. DLAMIs
-
Las nuevas instancias compatibles para cada DLAMI son las siguientes:
El aprendizaje profundo con el controlador patentado de Nvidia es compatible con G3 (no se admite G3.16x), P3, P3dn e Inf1
Aprendizaje profundo con OSS El controlador Nvidia es compatible con G4dn, G5, P4d, P4de.
Eliminaciones
Se eliminó la compatibilidad con las EC2 instancias G4dn, G5 y G3.16x del controlador DLAMI patentado de Nvidia.
Versión 76.8
Fecha de lanzamiento: 2024-03-20
Nombres AMI
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 76.8
Added
Se agregó awscliv2 en la AMI como/usr/local/bin/aws2, alongside awscliv1 as /usr/local/bin/awsen la AMI del controlador propietario de Nvidia
Versión 76.7
Fecha de lanzamiento: 2024-03-20
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 76.7
Added
Se agregó awscliv2 en la AMI como/usr/local/bin/aws2, alongside awscliv1 as /usr/local/bin/awsen la AMI del controlador Nvidia OSS
-
El controlador OSS Nvidia DLAMI actualizado con soporte para G4dn y G5, según su soporte actual, se ve a continuación:
El controlador Nvidia AMI (Amazon Linux 2) patentado por Deep Learning Base es compatible con P3, P3dn, G3, G5 y G4dn.
El controlador Nvidia AMI de Deep Learning Base OSS (Amazon Linux 2) es compatible con G4dn, G5, P4 y P5.
Se recomienda utilizar el controlador DLAMIs OSS Nvidia para G4dn, G5, P4, P5.
Versión 7.6.3
Fecha de lanzamiento: 14/02/2020
Actualizado
Actualizado TensorFlow de la 2.13.0 a la 2.15.0
Se actualizó la EFA de la 1.29.0 a la 1.30.0
Se ha actualizado AWS el -OFI-NCCL de la 1.7.3-aws a la 1.7.4-aws
Se actualizó el controlador Nvidia a 535.104.12 en la AMI del controlador Nvidia patentado por Deep Learning
Se actualizó el controlador Nvidia a 535.154.05 en la AMI del controlador Nvidia OSS de aprendizaje profundo
Versión 76.2
Fecha de lanzamiento: 2024-02-02
Nombres AMI
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 76.2
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 76.4
Seguridad
Versión 7.6.1
Fecha de lanzamiento: 27-12-2020
Actualizado
Actualizado PyTorch de la 2.0.1 a la 2.1.0
Versión 75.1
Fecha de lanzamiento: 17-11-2020
Consulte Cambios importantes en la DLAMI
Nombres AMI
Controlador Nvidia AMI de Deep Learning OSS (Amazon Linux 2) versión 75.1
Controlador Nvidia patentado por Deep Learning (Amazon Linux 2) versión 75.1
Added
-
AWS La AMI de aprendizaje profundo (DLAMI) se divide en dos grupos separados:
DLAMI que utiliza el controlador propietario de Nvidia (compatible con P3, P3dn, G3, G5, G4dn).
DLAMI que usa el controlador OSS de Nvidia para habilitar EFA (para admitir P4, P5).
Consulte el anuncio público para obtener más información sobre la división de DLAMI.
AWS Las consultas cli anteriores se encuentran en las notas de la versión
, debajo del identificador AMI-ID de consulta con viñetas AWSCLI (la región de ejemplo es us-east-1)
Actualizado
La EFA se actualizó de la versión 1.26.1 a la 1.29.0
GDRCopy actualizado de 2.3 a 2.4
Versión 74.4
Fecha de lanzamiento: 2023-10-27
Actualizado
AWS El complemento OFI NCCL se actualizó de la versión 1.7.2 a la versión 1.7.3
Se actualizaron los directorios CUDA 12.0-12.1 con la versión 2.18.5 de NCCL
-
CUDA12.1 actualizado como versión CUDA predeterminada
Se actualizó LD_LIBRARY_PATH para que tuviera//usr/local/cuda-12.1/targets/x86_64-linux/lib/:/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1 and PATH to have /usr/local/cuda-12.1/bin
Para los clientes que deseen cambiar a una versión de CUDA diferente, defina las variables LD_LIBRARY_PATH y PATH en consecuencia.
Added
-
La aplicación de parches en vivo del núcleo ahora está habilitada. La aplicación de parches en tiempo real permite a los clientes aplicar parches para vulnerabilidades de seguridad y errores críticos a un núcleo de Linux en ejecución, sin reinicios ni interrupciones en las aplicaciones en ejecución.
Tenga en cuenta que el soporte de parches en tiempo real para el kernel 5.10.192 finalizará el 30 de noviembre de 2013.
Versión 74.0
Fecha de lanzamiento: 2023-07-19
Actualizado
-
Actualizado TensorFlow de la 2.12 a la 2.13
En esta versión, Horovod se ha eliminado del entorno de conda. Consulte el Aviso para obtener más información sobre la instalación de horovod.
Versión 73.1
Fecha de lanzamiento: 12/06/2020
Actualizado
Actualizado PyTorch de la 2.0.0 a la 2.0.1