AWS GPU AMI de aprendizaje profundo TensorFlow 2.16 (Amazon Linux 2) - AWS Deep Learning AMIs

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

AWS GPU AMI de aprendizaje profundo TensorFlow 2.16 (Amazon Linux 2)

Si necesita ayuda para empezar, consulteIntroducción a las DLAMI.

Formato de nombre AMI

  • Controlador Nvidia AMI GPU TensorFlow 2.16 patentado por Deep Learning (Amazon Linux 2) $ {YYY-MM-DD}

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) $ {YYY-MM-DD}

EC2 Instancias compatibles

  • Consulte Cambios importantes en la DLAMI.

  • El controlador Nvidia de aprendizaje profundo con OSS es compatible con G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en.

  • El aprendizaje profundo con el controlador patentado de Nvidia es compatible con G3 (no compatible con G3.16x), P3 y P3dn

La AMI incluye lo siguiente:

  • AWS Servicio compatible: EC2

  • Sistema operativo: Amazon Linux 2

  • Arquitectura de cómputo: x86

  • Python:/opt/tensorflow/bin/python3.10

  • TensorFlow versión: 2.16

  • Controlador NVIDIA:

    • Controlador OSS Nvidia: 550.144.03

    • Controlador Nvidia patentado: 550.144.03

  • Pila de NVIDIA: CUDA12

    • Ruta de instalación de CUDA, NCCL y CUDDN:/-12.2/ usr/local/cuda

  • Instalador EFA: 1.34.0

  • AWS CLI v2 como aws2 y v1 como aws AWS CLI

  • Tipo de volumen de EBS: gp3

  • Consulte el AMI-ID con el parámetro SSM (la región de ejemplo es us-east-1):

    • Controlador OSS Nvidia:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • Controlador Nvidia patentado:

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • Consulta el AMI-ID con AWSCLI (la región de ejemplo es us-east-1):

    • Controlador OSS Nvidia:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • Controlador Nvidia patentado:

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

Aviso

Kit de herramientas NVIDIA Container 1.17.4

En la versión 1.17.4 del Container Toolkit, el montaje de bibliotecas compatibles con CUDA ahora está deshabilitado. Para garantizar la compatibilidad con varias versiones de CUDA en los flujos de trabajo de contenedores, asegúrese de actualizar su LD_LIBRARY_PATH para incluir sus bibliotecas de compatibilidad con CUDA, tal como se muestra en el tutorial «Si usa una capa de compatibilidad con CUDA», aquí: -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat

Actualizaciones futuras del sistema operativo TensorFlow

TensorFlow La versión 2.16 será la última DLAMI que utilice el sistema operativo Ubuntu 20.04. A partir de la TensorFlow versión 2.17 y superior, DLAMIs empezará a utilizar Ubuntu 22.04 como sistema operativo base. Los clientes que deseen actualizar a estas nuevas versiones deben asegurarse de que sus flujos de trabajo estén preparados para esta actualización.

La versión de Keras está fijada a la 2.0 en lugar de a la 3.0

Con la última versión TF2 1.6, Keras se ha actualizado de la versión principal 2 a la versión principal 3.0. Esta versión de Keras es una reescritura completa del paquete de Keras (consulte la documentación de Keras 3 para obtener más información). Para garantizar la compatibilidad con los flujos de trabajo de los clientes, hemos fijado las versiones de Keras en la 2.0 mediante la variable de entorno TF_USE_LEGACY_KERAS=1. Si sus flujos de trabajo requieren el uso de Keras 3.0, elimine esta variable de entorno de su entorno virtual /opt/tensorflow mediante el siguiente script: TensorFlow

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS

Fecha de lanzamiento: 17/02/2021

Nombres AMI:

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20250215

  • Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215 patentado por Deep Learning

Actualizado
Eliminaciones

Fecha de lanzamiento: 20 de enero de 2020

Nombres AMI:

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20250120

  • Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250118 patentado por Deep Learning

Actualizado

Fecha de lanzamiento: 23 de octubre de 2022

Nombres AMI:

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20241022

  • Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241023 patentado por Deep Learning

Actualizado

Fecha de lanzamiento: 28 de septiembre de 2020

Nombres AMI:

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

  • Controlador Nvidia AMI GPU TensorFlow 2.16 patentado por Deep Learning (Amazon Linux 2) 20240928

Actualizado

Fecha de lanzamiento: 21 de septiembre de 2020

Nombres AMI:

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

  • Controlador Nvidia AMI GPU TensorFlow 2.16 patentado por Deep Learning (Amazon Linux 2) 20240921

Actualizado
  • Se actualizaron el controlador Nvidia y Fabric Manager de la versión 535.183.01 a la 550.90.07

  • Se actualizó la versión EFA de la 1.32.0 a la 1.34.0

  • PyTorch Versión actualizada de la versión 2.3.0 a la 2.3.1

Added
  • Se agregó soporte para la EC2 instancia P5e en las imágenes del controlador OSS Nvidia.

Fecha de lanzamiento: 19 de agosto de 2020

Nombres AMI:

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240817

Added

Versión 2.16.2 - Fecha de lanzamiento: 26 de julio de 2020

Nombres AMI:

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240725

Actualizado
  • Se actualizó la versión TensorFlow del parche de la versión 2.16.1 a la 2.16.2

  • Se resolvió una versión TensorFlow secundaria incorrecta en DLAMI publicada el 17 de julio de 2022

    • La versión 20240717 del controlador Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240717 contenía TensorFlow inadvertidamente la versión secundaria 2.17 en lugar de la 2.16. Asegúrese de que los flujos de trabajo que dependen de la versión TensorFlow 2.16 se actualicen a la última DLAMI.

Versión 2.16.1. Fecha de lanzamiento: 10/06/2020

Nombres AMI:

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240607

  • Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240610 patentado por Deep Learning

Actualizado
  • Se actualizó la versión del controlador Nvidia a 535.183.01 desde 535.161.08

Fecha de lanzamiento: 5-05-2020

Consulte Cambios importantes en la DLAMI

Nombres AMI:

  • Controlador Nvidia AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510 patentado por Deep Learning

  • Controlador Nvidia de aprendizaje profundo OSS Nvidia GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

Added
  • Versión inicial de:

    • Controlador Nvidia de la serie AMI GPU TensorFlow 2.16 (Amazon Linux 2) patentado por Deep Learning.

    • Controlador Nvidia de aprendizaje profundo OSS de la serie AMI GPU TensorFlow 2.16 (Amazon Linux 2).

    • El software incluye lo siguiente:

      • «nvidia-driver=535.161.08"

      • «fabric-manager=535.161.08"

      • «cuda=12,3"

      • «cudnn=8.9.7"

      • «efa=1.32.0"

      • «nccl=2,21,5»

      • «aws-nccl-ofi-plugin=v1.9.1-aws»

  • Se agregó el entorno virtual tensorflow (fuente del comando de activación/). opt/tensorflow/bin/activate Este entorno incluye lo siguiente:

    • «tensorflow=2.16.1"

    • NOTA

      • A partir de la TF2 versión 1.6, se elimina la API tf.estimator.

        • Para seguir usando tf.estimator, necesitará usar TF 2.15 o una versión anterior. Consulte las notas de la versión TensorFlow 2.16.1 para obtener más información

      • Para garantizar la compatibilidad con los flujos de trabajo de los clientes, hemos fijado las versiones de Keras en la 2.0 mediante la variable de entorno TF_USE_LEGACY_KERAS=1. Si sus flujos de trabajo requieren el uso de Keras 3.0, elimine esta variable de entorno de su entorno virtual /opt/tensorflow mediante el siguiente script: TensorFlow

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS