Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
AWS GPU AMI de aprendizaje profundo TensorFlow 2.16 (Amazon Linux 2)
Para obtener ayuda para comenzar, consulte Introducción a las DLAMI.
Formato de nombre de AMI
Controlador Nvidia AMI GPU TensorFlow 2.16 patentado por Deep Learning (Amazon Linux 2) $ {YYY-MM-DD}
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) $ {YYY-MM-DD}
EC2 Instancias compatibles
Consulte Cambios importantes en las DLAMI.
El aprendizaje profundo con el controlador NVIDIA de código abierto admite G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e y P5en.
El aprendizaje profundo con el controlador propietario de NVIDIA admite G3 (no admite G3.16x), P3 y P3dn.
La AMI incluye lo siguiente:
AWS Servicio compatible: EC2
Sistema operativo: Amazon Linux 2
Arquitectura de computación: x86
Python:/opt/tensorflow/bin/python3.10
TensorFlow versión: 2.16
Controlador de NVIDIA:
Controlador con software de código abierto de Nvidia: 550.144.03
Controlador NVIDIA propietario: 550.144.03
Pila de NVIDIA CUDA12 :
Ruta de instalación de CUDA, NCCL y CUDDN:/-12.2/ usr/local/cuda
Instalador de EFA: 1.34.0
AWS CLI v2 como aws2 y v1 como aws AWS CLI
Tipo de volumen EBS: gp3
AMI-ID de la consulta con el parámetro de SSM (la región de ejemplo es us-east-1):
Controlador NVIDIA de código abierto:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output textControlador NVIDIA propietario:
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
Consulta el AMI-ID con AWSCLI (la región de ejemplo es us-east-1):
Controlador NVIDIA de código abierto:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output textControlador NVIDIA propietario:
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
Aviso
Kit de herramientas de contenedores de NVIDIA: 1.17.4
En la versión 1.17.4 del kit de herramientas de contenedores, el montaje de bibliotecas de compatibilidad con CUDA se ha desactivado. Para garantizar la compatibilidad con varias versiones de CUDA en los flujos de trabajo de contenedores, asegúrese de actualizar su LD_LIBRARY_PATH para incluir sus bibliotecas de compatibilidad con CUDA, tal como se muestra en el tutorial «Si usa una capa de compatibilidad con CUDA», aquí: -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat
Actualizaciones futuras del sistema operativo TensorFlow
TensorFlow La versión 2.16 será la última DLAMI que utilice el sistema operativo Ubuntu 20.04. A partir de la TensorFlow versión 2.17 y superior, DLAMIs empezará a utilizar Ubuntu 22.04 como sistema operativo base. Los clientes que deseen actualizar a estas nuevas versiones deben asegurarse de que sus flujos de trabajo estén preparados para esta actualización.
La versión de Keras está anclada a la 2.0 en lugar de a la 3.0
Con la última versión TF2 1.6, Keras se ha actualizado de la versión principal 2 a la versión principal 3.0. Esta versión de Keras es una reescritura completa del paquete de Keras (consulte la documentación de Keras 3
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS
Fecha de lanzamiento: 17 de febrero de 2020
Nombres de AMI:
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20250215
Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215 patentado por Deep Learning
Actualizado
Se ha actualizado el kit de herramientas de contenedores de NVIDIA de la versión 1.17.3 a la versión 1.17.4.
En la versión 1.17.4 del kit de herramientas de contenedores, el montaje de bibliotecas de compatibilidad con CUDA se ha desactivado. Para garantizar la compatibilidad con varias versiones de CUDA en los flujos de trabajo de contenedores, asegúrate de actualizar tu LD_LIBRARY_PATH para incluir tus bibliotecas de compatibilidad con CUDA, tal y como se muestra en el tutorial «Si utilizas una capa de compatibilidad con CUDA», aquí: -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat
Eliminaciones
Se han retirado las bibliotecas de espacio de usuario cuobj y nvdisasm proporcionadas por el kit de herramientas de CUDA de NVIDIA
para corregir los CVE que figuran en el boletín de seguridad del kit de herramientas de CUDA de NVIDIA del 18 de febrero de 2025 .
Fecha de la versión: 20/01/2025
Nombres de AMI:
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20250120
Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250118 patentado por Deep Learning
Actualizado
Se ha actualizado el controlador de NVIDIA de la versión 550.127.05 a la 550.144.03 para corregir los CVE que figuran en el boletín de seguridad de los controladores de pantalla de GPU de NVIDIA de enero de 2025
.
Fecha de la versión: 23/10/2024
Nombres de AMI:
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20241022
Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241023 patentado por Deep Learning
Actualizado
Se ha actualizado el controlador de NVIDIA de la versión 550.90.07 a la 550.127.05 para corregir los CVE que figuran en el boletín de seguridad de pantalla de GPU de NVIDIA de octubre de 2024
.
Fecha de la versión: 28/09/2024
Nombres de AMI:
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240928
Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928 patentado por Deep Learning
Actualizado
Se ha actualizado el kit de herramientas de contenedores de NVIDIA de la versión 1.16.1 a la 1.16.2 para corregir la vulnerabilidad de seguridad CVE-2024-0133
.
Fecha de la versión: 21/09/2024
Nombres de AMI:
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240921
Controlador Nvidia AMI GPU TensorFlow 2.16 patentado por Deep Learning (Amazon Linux 2) 20240921
Actualizado
Se han actualizado el controlador NVIDIA y Fabric Manager de la versión 535.183.01 a la 550.90.07.
Se ha actualizado EFA de la versión 1.32.0 a la 1.34.0.
PyTorch Versión actualizada de la versión 2.3.0 a la 2.3.1
Added
Se agregó soporte para la EC2 instancia P5e en las imágenes del controlador OSS Nvidia.
Fecha de la versión: 19/08/2024
Nombres de AMI:
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240817
Added
Versión 2.16.2. - Fecha de lanzamiento: 26/07/2024
Nombres de AMI:
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240725
Actualizado
Se actualizó la versión TensorFlow del parche de la versión 2.16.1 a la 2.16.2
Se resolvió una versión TensorFlow secundaria incorrecta en DLAMI publicada el 17 de julio de 2022
La versión 20240717 del controlador Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240717 contenía TensorFlow inadvertidamente la versión secundaria 2.17 en lugar de la 2.16. Asegúrese de que los flujos de trabajo que dependen de la versión TensorFlow 2.16 se actualicen a la última DLAMI.
Versión 2.16.1 - Fecha de lanzamiento: 10/06/2024
Nombres de AMI:
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240607
Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240610 patentado por Deep Learning
Actualizado
Se ha actualizado la versión del controlador NVIDIA de la 535.183.01 a la 535.161.08.
Fecha de lanzamiento: 5-10 de abril de 2020
Consulte Cambios importantes en las DLAMI.
Nombres de AMI:
Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510 patentado por Deep Learning
Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240510
Added
Publicación inicial de:
Controlador Nvidia de la serie AMI GPU TensorFlow 2.16 (Amazon Linux 2) patentado por Deep Learning.
Controlador Nvidia de aprendizaje profundo OSS de la serie AMI GPU TensorFlow 2.16 (Amazon Linux 2).
El software incluye lo siguiente:
“nvidia-driver=535.161.08”
"fabric-manager=535.161.08”
“cuda=12.3”
“cudnn=8.9.7”
“efa=1.32.0”
“nccl=2.21.5”
«aws-nccl-ofi-plugin=v1.9.1-aws»
Se agregó el entorno virtual tensorflow (fuente del comando de activación/). opt/tensorflow/bin/activate Este entorno incluye lo siguiente:
“tensorflow=2.16.1”
NOTA:
A partir de la TF2 versión 1.6, se elimina la API tf.estimator.
Para seguir usando tf.estimator, se deberá usar TF 2.15 o una versión anterior. Consulte las notas de la versión TensorFlow 2.16.1
para obtener más información
Para garantizar la compatibilidad con los flujos de trabajo de los clientes, hemos anclado las versiones de Keras en la 2.0 mediante la variable de entorno TF_USE_LEGACY_KERAS=1. Si sus flujos de trabajo requieren el uso de Keras 3.0, elimine esta variable de entorno de su entorno TensorFlow virtual /opt/tensorflow mediante el siguiente script:
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS