

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# AWS AMI de GPU de base de aprendizaje profundo (Ubuntu 20.04)
<a name="aws-deep-learning-base-gpu-ami-ubuntu-20.04"></a>

#### Notificación del fin del soporte
<a name="out-of-support-base-gpu-ami-ubuntu-20.04"></a>
+ Ubuntu Linux 20.04 LTS va a finalizar su período de cinco años de LTS el 31 de mayo de 2025 y su proveedor ya no lo admite.* *En consecuencia, la AMI de GPU AWS Deep Learning Base (Ubuntu 20.04) no tendrá actualizaciones después del 31 de mayo de 2025. Las versiones anteriores seguirán estando disponibles. Tenga en cuenta que cualquier AMI que se publique quedará obsoleta en EC2 después de 2 años desde su fecha de creación. Consulte [Retirada de una AMI de Amazon EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ami-deprecate.html) para obtener más información.
+ Durante 3 meses, hasta el 31 de agosto de 2025, solo se proporcionará soporte para problemas de funcionalidad (no para parches de seguridad).
+ Los usuarios de la DLAMI con Ubuntu 20.04 deben pasarse a la [AMI de GPU de base para aprendizaje profundo de AWS (Ubuntu 22.04)](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-22-04/) o a la [AMI de GPU de base para aprendizaje profundo de AWS (Ubuntu 24.04)](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-24-04/). Como alternativa, también se puede utilizar la [AMI de base para aprendizaje profundo de AWS (Amazon Linux 2023)](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-amazon-linux-2023/).

Para obtener ayuda para comenzar, consulte [Introducción a las DLAMI](getting-started.md).

#### Formato de nombre de AMI
<a name="name-base-gpu-ami-ubuntu-20.04"></a>
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) \$1\$1YYYY-MM-DD\$1
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) \$1\$1YYYY-MM-DD\$1

#### Instancias de EC2 admitidas
<a name="instances-base-gpu-ami-ubuntu-20.04"></a>
+ Consulte [Cambios importantes en las DLAMI](important-changes.md).
+ El aprendizaje profundo con el controlador NVIDIA de código abierto admite G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e y P5en.
+ El aprendizaje profundo con el controlador propietario de NVIDIA admite G3 (no admite G3.16x), P3 y P3dn.

#### La AMI incluye lo siguiente:
<a name="contents-base-gpu-ami-ubuntu-20.04"></a>
+ ** AWS Servicio compatible**: Amazon EC2
+ **Sistema operativo**: Ubuntu 20.04
+ **Arquitectura de computación**: x86
+ **La última versión disponible está instalada para los siguientes paquetes:**
  + **Kernel de Linux** 5.15
  + **FSx Lustre**
  + **Docker**
  + **AWS CLI v2** en/usr/local/bin/aws2 y **AWS CLI v1** en/usr/bin/aws
  + **DCGM de NVIDIA**
  + **Kit de herramientas de contenedor de NVIDIA**:
    + Comando de versión: nvidia-container-cli -V
  + **Nvidia-Docker2**:
    + Comando de versión: versión nvidia-docker
+ **Controlador de NVIDIA**:
  + Controlador con software de código abierto de NVIDIA: 550.163.01
  + Controlador NVIDIA propietario: 550.163.01
+ **Pila NVIDIA CUDA 11.7, 12.1-12.4**:
  + Directorios de instalación de CUDA, NCCL y CUDDN:/-xx.x/ usr/local/cuda
    + Ejemplo:/-12.1/ usr/local/cuda
  + Versión NCCL compilada: 2.22.3\$1 4. CUDA12
  + **CUDA predeterminado:** 12.1
    + **PATH//apunta a CUDA 12.1 usr/local/cuda**
    + Se han actualizado las siguientes variables de entorno:
      + LD\$1LIBRARY\$1PATH tendrá/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1:/usr/local/cuda-12.1/targets/x86\$164-linux/lib
      + PATH para tener//usr/local/cuda-12.1/bin/:/usr/local/cuda-12.1/include
      + Para cualquier versión de CUDA diferente, actualice LD\$1LIBRARY\$1PATH como sea necesario.
  + **Ubicación de las pruebas de NCCL:**
    + all\$1reduce, all\$1gather y reduce\$1scatter:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test
    + Para ejecutar las pruebas de NCCL, es necesario pasar LD\$1LIBRARY\$1PATH con las siguientes actualizaciones.
      + Los comunes ya PATHs están agregados a LD\$1LIBRARY\$1PATH:
        + `/opt/amazon/efa/lib:/opt/amazon/openmpi/lib:/opt/aws-ofi-nccl/lib:/usr/local/lib:/usr/lib`
      + Para cualquier versión de CUDA diferente, actualice LD\$1LIBRARY\$1PATH como sea necesario.
+ **Instalador de EFA:** 1.39.0
+ **Nvidia: 2.4 GDRCopy**
+ **AWS Plugin OFI NCCL**: se instala como parte del `EFA Installer-aws`
  + AWS OFI NCCL ahora admite múltiples versiones de NCCL con una sola versión
  + **Ruta de instalación:.** `/opt/aws-ofi-nccl/` `/opt/aws-ofi-nccl/lib`La ruta se agrega a LD\$1LIBRARY\$1PATH.
  + **Comprueba la ruta** del anillo, message\$1transfer: `/opt/aws-ofi-nccl/tests`
+ **Tipo de volumen EBS**: gp3
+ **Python**:/usr/bin/python3.9
+ **NVMe Ubicación del almacén de instancias (en [instancias EC2 compatibles](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/instance-store-volumes.html#available-instance-store-volumes)):/**opt/dlami/nvme
+ **AMI-ID de la consulta con el parámetro de SSM (la región de ejemplo es us-east-1):**
  + **Controlador NVIDIA de código abierto**:

    ```
    aws ssm get-parameter --region us-east-1 \
        --name /aws/service/deeplearning/ami/x86_64/base-oss-nvidia-driver-gpu-ubuntu-20.04/latest/ami-id  \
        --query "Parameter.Value" \
        --output text
    ```
  + Controlador NVIDIA propietario:

    ```
    aws ssm get-parameter --region us-east-1 \
        --name /aws/service/deeplearning/ami/x86_64/base-proprietary-nvidia-driver-gpu-ubuntu-20.04/latest/ami-id \
        --query "Parameter.Value" \
        --output text
    ```
+ **Consulta el AMI-ID con AWSCLI (por ejemplo, la región es us-east-1):**
  + **Controlador NVIDIA de código abierto**:

    ```
    aws ec2 describe-images --region us-east-1 \
        --owners amazon \
        --filters 'Name=name,Values=Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 20.04) ????????' 'Name=state,Values=available' \
        --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \
        --output text
    ```
  + **Controlador NVIDIA propietario:**

    ```
    aws ec2 describe-images --region us-east-1 \
        --owners amazon \
        --filters 'Name=name,Values=Deep Learning Base Proprietary Nvidia Driver GPU AMI (Ubuntu 20.04) ????????' 'Name=state,Values=available' \
        --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \
        --output text
    ```

#### ​Avisos
<a name="notices-base-gpu-ami-ubuntu-20.04"></a>

**Kit de herramientas de contenedor de NVIDIA 1.17.4**

En la versión 1.17.4 del kit de herramientas de contenedores, el montaje de bibliotecas de compatibilidad con CUDA se ha desactivado. Para garantizar la compatibilidad con varias versiones de CUDA en los flujos de trabajo de contenedores, asegúrese de actualizar su LD\$1LIBRARY\$1PATH para incluir las bibliotecas de compatibilidad con CUDA, tal y como se muestra en el tutorial [Si utiliza una capa de compatibilidad CUDA.](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat)

**EFA se actualiza de la versión 1.37 a la 1.38 (publicada el 04/02/2025)**

EFA ahora incluye el complemento AWS OFI NCCL, que ahora se encuentra en lugar del original. `/opt/amazon/ofi-nccl` `/opt/aws-ofi-nccl/` Si va a actualizar la variable LD\$1LIBRARY\$1PATH, asegúrese de modificar correctamente la ubicación de OFI NCCL.

**Política de Support**

Los componentes de esta AMI, por ejemplo, las versiones de CUDA, se pueden eliminar y cambiar según la [política de compatibilidad del marco](support-policy.md), para optimizar el rendimiento de los [contenedores de aprendizaje profundo](https://aws.amazon.com/machine-learning/containers/) o para reducir el tamaño de la AMI en una versión futura, sin previo aviso. Eliminamos las versiones CUDA AMIs si no las utiliza ninguna versión de marco compatible.

**Instancias EC2 con varias tarjetas de red**
+ Muchos tipos de instancias que admiten EFA también tienen varias tarjetas de red.
+ DeviceIndex es exclusivo de cada tarjeta de red y debe ser un número entero no negativo inferior al límite de ENIs per. NetworkCard En P5, el número de ENIs per NetworkCard es 2, lo que significa que los únicos valores válidos DeviceIndex son 0 o 1.
  + Para la interfaz de red principal (índice de tarjetas de red 0, índice de dispositivos 0), cree una interfaz de EFA (EFA con ENA). No puede utilizar una interfaz de red exclusiva para EFA como interfaz de red principal.
  + Para cada interfaz de red adicional, use el siguiente índice de tarjetas de red no utilizado, el índice de dispositivos 1 y una interfaz de red de EFA (EFA con ENA) o solo EFA, según el caso de uso, como los requisitos de ancho de banda de ENA o el espacio de direcciones IP. Para ver ejemplos de casos de uso, consulte Configuración de EFA para instancias P5.
  + Para obtener más información, consulte la Guía de usuario de EFA [aquí](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/efa-acc-inst-types.html).

**Instancias P5/P5e**
+ Las instancias P5 y P5e contienen 32 tarjetas de interfaz de red y se pueden iniciar mediante el siguiente comando: AWS CLI 

```
aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
       ...
      "NetworkCardIndex=31,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"
```

**Instancias P5en**
+ Las P5en contienen 16 tarjetas de interfaz de red y se pueden iniciar mediante el siguiente comando: AWS CLI 

```
aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
       ...
      "NetworkCardIndex=15,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"
```

**Kernel**
+ La versión del kernel se ancla mediante el comando:

  ```
  echo linux-aws hold | sudo dpkg —set-selections
  echo linux-headers-aws hold | sudo dpkg —set-selections
  echo linux-image-aws hold | sudo dpkg —set-selections
  ```
+ Recomendamos a los usuarios que eviten actualizar su versión de kernel (a menos que sea debido a un parche de seguridad) para garantizar la compatibilidad con los controladores y las versiones de los paquetes instalados. Si aún así desean hacerlo, pueden ejecutar los siguientes comandos para desanclar sus versiones de kernel:

  ```
  echo linux-aws install | sudo dpkg -set-selections
  echo linux-headers-aws install | sudo dpkg -set-selections
  echo linux-image-aws install | sudo dpkg -set-selections
  ```
+ Para cada nueva versión de DLAMI, se utiliza el último kernel compatible disponible.

#### Fecha de la versión: 24/04/2025
<a name="2025-04-24-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20250424
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20250424

##### Actualizado
<a name="w2aac25c13b5b5c13b5"></a>
+ [Se actualizó el controlador Nvidia de la versión 550.144.03 a la 550.163.01 para adaptarlo a lo indicado en el boletín de seguridad del controlador de pantalla de GPU de CVEs NVIDIA de abril de 2025](https://nvidia.custhelp.com/app/answers/detail/a_id/5630)

#### Fecha de lanzamiento: 17 de febrero de 2021
<a name="2025-02-17-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20250214
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20250214

##### Actualizado
<a name="w2aac25c13b5b5c15b5"></a>
+ Se ha actualizado el kit de herramientas de contenedores de NVIDIA de la versión 1.17.3 a la versión 1.17.4.
  + [Consulte la página de notas de la versión aquí para obtener más información:/1.17.4 https://github.com/NVIDIA/ nvidia-container-toolkit releases/tag/v](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4)
  + En la versión 1.17.4 del kit de herramientas de contenedores, el montaje de bibliotecas de compatibilidad con CUDA se ha desactivado. Para garantizar la compatibilidad con varias versiones de CUDA en los flujos de trabajo de contenedores, asegúrese de actualizar su LD\$1LIBRARY\$1PATH para incluir las bibliotecas de compatibilidad con CUDA, tal y como se muestra en el tutorial [Si utiliza una capa de compatibilidad CUDA.](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat)

##### Eliminaciones
<a name="w2aac25c13b5b5c15b7"></a>
+ Se eliminaron las bibliotecas de espacio de usuario cuobj y nvdisasm proporcionadas por el kit de herramientas [CUDA de NVIDIA para abordar las CVEs presentes en el boletín de seguridad del kit de herramientas](https://docs.nvidia.com/cuda/) [NVIDIA](https://nvidia.custhelp.com/app/answers/detail/a_id/5594) CUDA del 18 de febrero de 2025

#### Fecha de lanzamiento: 4 de febrero de 2020
<a name="2025-02-04-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20250204
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20250204

##### Actualizado
<a name="w2aac25c13b5b5c17b5"></a>
+ Se ha actualizado EFA de la versión 1.37.0 a la 1.38.0.
  + EFA ahora incluye el complemento AWS OFI NCCL, que ahora se encuentra en lugar del original. `/opt/amazon/ofi-nccl` `/opt/aws-ofi-nccl/` Si va a actualizar la variable LD\$1LIBRARY\$1PATH, asegúrese de modificar correctamente la ubicación de OFI NCCL.

##### Eliminaciones
<a name="w2aac25c13b5b5c17b7"></a>
+ Se ha eliminado el paquete emacs de estos. DLAMIs Los clientes pueden instalar emacs desde GNU emacs. [https://www.gnu.org/software/emacs/download.html](https://www.gnu.org/software/emacs/download.html)

#### Fecha de lanzamiento: 17 de enero de 2020
<a name="2025-01-17-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20250117
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20250117

##### Actualizado
<a name="w2aac25c13b5b5c19b5"></a>
+ [Se actualizó el controlador Nvidia de la versión 550.127.05 a la 550.144.03 para adaptarlo a lo indicado en el boletín de seguridad del controlador de pantalla de GPU de NVIDIA de CVEs enero de 2025](https://nvidia.custhelp.com/app/answers/detail/a_id/5614)

#### Fecha de lanzamiento: 9 de diciembre de 2020
<a name="2024-12-09-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20241206
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20241206

##### Actualizado
<a name="w2aac25c13b5b5c21b5"></a>
+ Se ha actualizado el kit de herramientas de contenedores de NVIDIA de la versión 1.17.0 a la versión 1.17.3.

#### Fecha de la versión: 22/11/2024
<a name="2024-11-22-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20241122

##### Added
<a name="w2aac25c13b5b5c23b5"></a>
+ Se ha añadido compatibilidad para las instancias P5en EC2.

##### Actualizado
<a name="w2aac25c13b5b5c23b7"></a>
+ Se ha actualizado el instalador de EFA de la versión 1.35.0 a la 1.37.0.
+ Actualice el complemento AWS OFI NCCL de la versión 1.12.1-aws a la 1.13.0-aws

#### Fecha de la versión: 26/10/2024
<a name="2024-10-26-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20241025
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20241025

##### Actualizado
<a name="w2aac25c13b5b5c25b5"></a>
+ [Se actualizó el controlador de Nvidia de la versión 550.90.07 a la 550.127.05 para adaptarlo a lo indicado en el boletín de seguridad de las pantallas de GPU de NVIDIA de octubre de 2024 CVEs ](https://nvidia.custhelp.com/app/answers/detail/a_id/5586)

#### Fecha de la versión: 03/10/2024
<a name="2024-10-03-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240927

##### Actualizado
<a name="w2aac25c13b5b5c27b5"></a>
+ Se ha actualizado el kit de herramientas de contenedores de NVIDIA de la versión 1.16.1 a la versión 1.16.2.

#### Fecha de la versión: 27/08/2024
<a name="2024-09-27-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240827

##### Actualizado
<a name="w2aac25c13b5b5c29b5"></a>
+ Se han actualizado el controlador NVIDIA y Fabric Manager de la versión 535.183.01 a la 550.90.07.
+ Se ha actualizado EFA de la versión 1.32.0 a la 1.34.0.
+ Se ha actualizado NCCL a la última versión 2.22.3 para todas las versiones de CUDA.
  + CUDA 11.7 se actualizó desde la versión 2.16.2\$1 .7 CUDA11
  + CUDA 12.1 y 12.2 se actualizaron desde la versión 2.18.5\$1 2. CUDA12
  + CUDA 12.3 se actualizó desde la versión 2.21.5\$1. CUDA12

##### Added
<a name="w2aac25c13b5b5c29b7"></a>
+ Se agregó la versión 12.4 del kit de herramientas CUDA en el directorio/-12.4 usr/local/cuda
+ Se ha añadido compatibilidad para **instancias P5e EC2**.

##### Eliminaciones
<a name="w2aac25c13b5b5c29b9"></a>
+ Se ha eliminado la pila de la versión 11.8 del CUDA Toolkit presente en el directorio/-11.8 usr/local/cuda

#### Fecha de la versión: 19/08/2024
<a name="2024-08-19-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240816

##### Added
<a name="w2aac25c13b5b5c31b5"></a>
+ Se ha agregado compatibilidad para la [instancia G6e de EC2](https://aws.amazon.com/ec2/instance-types/g6e/).

#### Fecha de lanzamiento: 6 de junio de 2020
<a name="2024-06-06-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240606
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20240606

##### Actualizado
<a name="w2aac25c13b5b5c33b5"></a>
+ Se ha actualizado la versión del controlador NVIDIA de la 535.183.01 a la 535.161.08.

#### Fecha de lanzamiento: 15-05-2020
<a name="2024-05-15-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240515
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20240515

##### Added
<a name="w2aac25c13b5b5c35b5"></a>
+ Se agregó la pila back CUDA11 .7 en el directorio//usr/local/cuda-11.7 con CUDA11 .7, NCCL 2.16.2, CuDNN 8.7.0, ya que 1.13 es compatible con .7 PyTorch CUDA11

#### Fecha de lanzamiento: 2024-05-02
<a name="2024-05-02-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240502
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20240502

##### Actualizado
<a name="w2aac25c13b5b5c37b5"></a>
+ Se ha actualizado la versión de EFA de la 1.30 a la 1.32.
+ Se actualizó el complemento AWS OFI NCCL de la versión 1.7.4 a la versión 1.9.1
+ Se ha actualizado el kit de herramientas de contenedores de NVIDIA de la versión 1.13.5 a la versión [1.15.0](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.15.0).
  + **La versión 1.15.0 NO incluye los paquetes ni nvidia-docker2. nvidia-container-runtime [Se recomienda utilizar los nvidia-container-toolkit paquetes directamente siguiendo la documentación del kit de herramientas de contenedores de Nvidia.](https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/sample-workload.html)**

##### Added
<a name="w2aac25c13b5b5c37b7"></a>
+ Se agregó una pila CUDA12 3.3 con CUDA12 0.3, NCCL 2.21.5, CuDNN 8.97.

##### Eliminaciones
<a name="w2aac25c13b5b5c37b9"></a>
+ Se eliminaron las pilas .7, CUDA11 .0 presentes en los directorios/-12.0 CUDA12 usr/local/cuda-11.7 and /usr/local/cuda
+ [https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.15.0](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.15.0) nvidia-container-runtime

#### Fecha de la versión: 04/04/2024
<a name="2024-04-04-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI:** AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240404

##### Added
<a name="w2aac25c13b5b5c39b5"></a>
+ Las DLAMI con controlador NVIDIA de código abierto se han hecho compatibles con las instancias G6 y Gr6 de EC2. Consulta [Instancias de GPU recomendadas](gpu.md) para obtener más información.

#### Fecha de la versión: 29/03/2024
<a name="2024-03-29-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240326
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20240326

##### Actualizado
<a name="w2aac25c13b5b5c41b5"></a>
+ Se DLAMIs actualizó el controlador Nvidia de 535.104.12 a 535.161.08 tanto en el controlador Nvidia propietario como en el controlador OSS.
+ Se ha retirado la compatibilidad con las instancias G4dn y G5 EC2 de la DLAMI del controlador NVIDIA propietario.
+ Las nuevas instancias compatibles con cada DLAMI son las siguientes:
  + El aprendizaje profundo con el controlador propietario de NVIDIA admite G3 (no admite G3.16x), P3 y P3dn.
  + El aprendizaje profundo con el controlador NVIDIA de código abierto admite G4dn, G5, P4d, P4de y P5.

#### Fecha de la versión: 20/03/2024
<a name="2024-03-20-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240318
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20240318

##### Added
<a name="w2aac25c13b5b5c43b5"></a>
+ Se agregó `awscliv2` en la AMI en/usr/local/bin/aws2, junto con `awscliv1` usr/bin/aws /en la AMI propietaria y OSS Nvidia Driver

#### Fecha de la versión: 14/03/2024
<a name="2024-03-14-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240314

##### Actualizado
<a name="w2aac25c13b5b5c45b5"></a>
+ Se ha actualizado la DLAMI con controlador NVIDIA de código abierto con compatibilidad para G4dn y G5, por lo que su compatibilidad actual es la siguiente:
  + AMI base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) es compatible con P3, P3dn, G3, G5 y G4dn.
  + AMI base con controlador NVIDIA de código abierto para aprendizaje profundo (Ubuntu 20.04) es compatible con G5, G4dn, P4 y P5.
+  DLAMIs Se recomienda utilizar el controlador OSS Nvidia para G5, G4dn, P4 y P5.

#### Fecha de lanzamiento: 12/02/2020
<a name="2024-02-12-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240208
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20240208

##### Actualizado
<a name="w2aac25c13b5b5c47b5"></a>
+ AWS El complemento OFI NCCL se ha actualizado de la 1.7.3 a la 1.7.4

#### Fecha de lanzamiento: 01/02/2020
<a name="2024-02-01-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20240201
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20240201

##### Seguridad
<a name="w2aac25c13b5b5c49b5"></a>
+ Se ha actualizado la versión del paquete runc para incluirla en el parche para [CVE-2024-21626](https://nvd.nist.gov/vuln/detail/CVE-2024-21626).

#### Fecha de lanzamiento: 2023-12-04
<a name="2023-12-04-base-gpu-ami-ubuntu-20.04"></a>

**Nombres de AMI**
+ AMI de GPU base para aprendizaje profundo del controlador con software de código abierto de NVIDIA (Ubuntu 20.04) 20231204
+ AMI de GPU de base con controlador NVIDIA propietario para aprendizaje profundo (Ubuntu 20.04) 20231204

##### Added
<a name="w2aac25c13b5b5c51b5"></a>
+ AWS La AMI de aprendizaje profundo (DLAMI) se divide en dos grupos separados:
  + Las DLAMI que usan el controlador NVIDIA propietario (compatibles con P3, P3dn, G3, G5 y G4dn).
  + Las DLAMI que usan el controlador NVIDIA de código abierto para habilitar EFA (compatibles con P4 y P5).
+ Consulte [Cambios importantes en las DLAMI](important-changes.md) para obtener más información sobre la división de las DLAMI.
+ AWS CLI las consultas anteriores están debajo del identificador **AMI-ID de consulta con viñetas AWSCLI (por ejemplo, la región es us-east-1**)

##### Actualizado
<a name="w2aac25c13b5b5c51b7"></a>
+ EFA se ha actualizado de la versión 1.26.1 a la 1.29.0.
+ GDRCopy actualizado de 2.3 a 2.4

#### Fecha de la versión: 18/10/2023
<a name="2023-10-18-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20231018

##### Actualizado
<a name="w2aac25c13b5b5c53b5"></a>
+ AWS El complemento OFI NCCL se actualizó de la versión 1.7.2 a la versión 1.7.3
+ Se han actualizado los directorios de CUDA 12.0-12.1 con la versión 2.18.5 de NCCL para que coincidan con CUDA 12.2.
+ CUDA12.1 actualizado como la versión CUDA predeterminada
  + Se actualizó LD\$1LIBRARY\$1PATH para que tuviera//usr/local/cuda-12.1/targets/x86\$164-linux/lib/:/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1 and PATH to have /usr/local/cuda-12.1/bin
  + Si un cliente desea cambiar a una versión de CUDA distinta, debe definir las variables LD\$1LIBRARY\$1PATH y PATH en consecuencia.

#### Fecha de lanzamiento: 2023-10-02
<a name="2023-10-02-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20231002

##### Actualizado
<a name="w2aac25c13b5b5c55b5"></a>
+ Se ha actualizado el controlador NVIDIA de la 535.54.03 a la 535.104.12.
  + Este último controlador corrige los cambios importantes en la ABI de la NVML encontrados en la versión 535.54.03 del controlador, así como la regresión del controlador encontrada en la versión 535.86.10 que afectaba a los kits de herramientas de CUDA en las instancias P5. Consulte las siguientes notas de la versión de NVIDIA para obtener más información sobre las correcciones:
  + Consulte las siguientes notas de la versión de NVIDIA para obtener más información sobre las correcciones:
    + [4235941](https://docs.nvidia.com/datacenter/tesla/tesla-release-notes-535-104-05/index.html) - Corrección de un cambio importante en la ABI de la NVML
    + [4228552](https://docs.nvidia.com/datacenter/tesla/tesla-release-notes-535-104-12/index.html) - Corrección de errores del kit de herramientas de CUDA
+ Se han actualizado los directorios CUDA 12.2 con NCCL 2.18.5.
+ EFA se ha actualizado de la versión 1.24.1 a la última 1.26.1.

##### Added
<a name="w2aac25c13b5b5c55b7"></a>
+ Añadido CUDA12 0.2 a/12.2 usr/local/cuda

##### Eliminaciones
<a name="w2aac25c13b5b5c55b9"></a>
+ Se ha retirado el soporte para CUDA 11.5 y CUDA 11.6.

#### Fecha de la versión: 26/09/2023
<a name="2023-09-26-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20230926

##### Added
<a name="w2aac25c13b5b5c57b5"></a>
+ Se han añadido cambios en net.naming-scheme para solucionar el problema impredecible de nomenclatura de la interfaz de red ([enlace](https://bugs.launchpad.net/ubuntu/+source/systemd/+bug/1945225)) que se producía en la versión P5. Este cambio se realiza configurando net.naming-scheme=v247 en los argumentos de arranque de Linux del archivo/etc/default/grub

#### Fecha de la versión: 30/08/2023
<a name="2023-08-30-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20230830

##### Actualizado
<a name="w2aac25c13b5b5c59b5"></a>
+ `aws-ofi-nccl`El complemento se actualizó de la v1.7.1 a la v1.7.2

#### Fecha de la versión: 11/08/2023
<a name="2023-08-11-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20230811

##### Added
<a name="w2aac25c13b5b5c61b5"></a>
+ Esta AMI ahora admite la funcionalidad de entrenamiento de varios nodos en P5 y en todas las instancias de EC2 compatibles anteriormente.
+ Para la instancia EC2 de P5, se recomienda utilizar NCCL 2.18, que se ha agregado a las versiones .0 y .1. CUDA12 CUDA12

##### Eliminaciones
<a name="w2aac25c13b5b5c61b7"></a>
+ Se ha eliminado el soporte para 2.3 y 1.4. CUDA11 CUDA11

#### Fecha de la versión: 04/08/2023
<a name="2023-08-04-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20230804

##### Actualizado
<a name="w2aac25c13b5b5c63b5"></a>
+ Se actualizó el AWS complemento OFI NCCL a la versión 1.7.1
+ Se estableció CUDA11.8 como predeterminado, ya que la PyTorch versión 2.0 admite la versión 11.8 y, para la instancia EC2 P5, se recomienda utilizar >= .8 CUDA11
  + Se actualizó usr/local/cuda-11.8/targets/x86\$164-linux/lib/:/usr/local/cuda-11.8/lib:/usr/local/cuda-11.8/lib64:/usr/local/cuda-11.8 and PATH to have /usr/local/cuda-11.8/bin LD\$1LIBRARY\$1PATH para que tuviera//
  + Para cualquier versión de cuda diferente, defina LD\$1LIBRARY\$1PATH como sea necesario.
+ Se han actualizado los directorios CUDA 12.0 y 12.1 con NCCL 2.18.3.

##### Fixed
<a name="w2aac25c13b5b5c63b7"></a>
+ Se ha corregido el problema de carga de paquetes de NVIDIA Fabric Manager (FM) mencionado en la fecha de lanzamiento anterior,** **el 19 de julio de 2023.

#### Fecha de la versión: 19/07/2023
<a name="2023-07-19-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20230719

##### Actualizado
<a name="w2aac25c13b5b5c65b5"></a>
+ EFA se ha actualizado de la versión 1.22.1 a la 1.24.1.
+ Se ha actualizado el controlador NVIDIA de la versión 525.85.12 a la 535.54.03.

##### Added
<a name="w2aac25c13b5b5c65b7"></a>
+ Se han añadido cambios en el estado C para deshabilitar el estado inactivo del procesador configurando el estado C máximo en C1. Este cambio se realiza configurando `intel\$1idle.max\$1cstate=1 processor.max\$1cstate=1` en los argumentos de arranque de Linux del archivo/etc/default/grub
+ AWS Compatibilidad con instancias EC2 P5:
  + Se ha añadido compatibilidad con instancias EC2 P5 para flujos de trabajo que utilizan un solo nodo o instancia. En una próxima versión se añadirá el soporte para varios nodos (por ejemplo, para el entrenamiento con varios nodos) mediante EFA (Elastic Fabric Adapter) y el complemento AWS OFI NCCL.
  + Utilice la versión de CUDA 11.8 o una superior para obtener un rendimiento óptimo.
  + Problema conocido: el paquete de NVIDIA Fabric Manager (FM) tarda en cargar en P5, los clientes tienen que esperar de 2 a 3 minutos hasta que se cargue FM tras iniciar la instancia de P5. Para comprobar si FM está iniciado, ejecute el comando sudo systemctl is-active nvidia-fabricmanager. Debe devolver active antes de iniciar cualquier flujo de trabajo. Esto se mejorará en una próxima versión.

#### Fecha de lanzamiento: 19 de mayo de 2020
<a name="2023-05-19-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20230519

##### Actualizado
<a name="w2aac25c13b5b5c67b5"></a>
+ EFA se ha actualizado a la última versión 1.22.1.
+ Se ha actualizado la versión NCCL para CUDA 12.1 a la 2.17.1.

##### Added
<a name="w2aac25c13b5b5c67b7"></a>
+ Añadido .1 a/-12.1 CUDA12 usr/local/cuda
+ Se agregó soporte para el [monitor de GPU NVIDIA Data Center (DCGM)](https://developer.nvidia.com/dcgm) a través del paquete datacenter-gpu-manager
  + Puede comprobar el estado de este servicio mediante la siguiente consulta: sudo systemctl status nvidia-dcgm.
+ Los almacenes de instancias NVMe efímeras ahora se montan automáticamente en las instancias EC2 compatibles y se puede acceder al almacenamiento en la carpeta//. opt/dlami/nvme Puede comprobar o modificar este servicio de las siguientes maneras:
  + Compruebe el estado del NVMe servicio: sudo systemctl status dlami-nvme
  + Para acceder al servicio o modificarlo: `/opt/aws/dlami/bin/nvme_ephemeral_drives.sh`
+ NVMe Volumes proporcionó las soluciones de almacenamiento más rápidas y eficientes para flujos de trabajo de alto rendimiento que requieren un rendimiento de IOPS. Los almacenes de NVMe instancias efímeras se incluyen en el costo de las instancias, por lo que este servicio no implica ningún costo adicional.
+ Los almacenes de instancias NVMe solo se montarán en las instancias EC2 que los admitan. Para obtener información sobre las instancias EC2 con almacenes de instancias NVMe compatibles, consulta los [volúmenes de almacenes de instancias disponibles](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/instance-store-volumes.html#available-instance-store-volumes) y valida si son compatibles NVMe .
+ Para mejorar el rendimiento del disco y reducir las penalizaciones en la primera escritura, puede inicializar los almacenes de instancias (tenga en cuenta que este proceso puede tardar horas en función del tipo de instancia EC2). [Cómo inicializar los volúmenes de almacenes de instancias en las instancias EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/disk-performance.html)
+ **NOTA**: los almacenes de NVMe instancias se montan en la instancia y no están conectados a la red como EBS. Es posible que los datos de estos NVMe volúmenes se pierdan al reiniciar o detener la instancia.

#### Fecha de la versión: 17/04/2023
<a name="2023-04-17-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de AMI:** AMI de GPU de base para aprendizaje profundo (Ubuntu 20.04) 20230414

##### Actualizado
<a name="w2aac25c13b5b5c69b5"></a>
+ Se actualizó el nombre DLAMI AWS de Deep Learning Base AMI GPU CUDA 11 (Ubuntu 20.04) \$1 \$1YYY-MM-DD\$1 a Deep Learning Base GPU AMI (Ubuntu 20.04) \$1 \$1YYY-MM-DD\$1
  + Tenga en cuenta que, durante un mes a partir de esta publicación, seguiremos ofreciendo la DLAMI más reciente con el de la AMI anterior para cualquier soporte necesario. Los clientes pueden actualizar sus paquetes de sistema operativo mediante apt-get update && apt-get upgrade para aplicar los parches de seguridad.
+ Se actualizó AWS la ruta del complemento OFI NCCL de a `/usr/local/cuda-xx.x/efa/` `/opt/aws-ofi-nccl/`
+ Se actualizó NCCL a una [rama GIT personalizada](https://github.com/NVIDIA/nccl/tree/inc_nsteps) de la versión 2.16.2, escrita en colaboración con un equipo de NCCL para todas las versiones de CUDA. AWS Funciona AWS mejor en la infraestructura.

##### Added
<a name="w2aac25c13b5b5c69b7"></a>
+ Se agregó CUDA12 3.0 a/usr/local/cuda-12.0
+ Se ha agregado [AWS FSx](https://aws.amazon.com/fsx/)
+ Se agregó soporte para Python versión 3.9 en/usr/bin/python3.9
  + Tenga en cuenta que este cambio no reemplaza el sistema predeterminado de Python, python3 seguirá apuntando al sistema Python3.8.
  + Se puede acceder a Python3.9 mediante los siguientes comandos:

    ```
    /usr/bin/python3.9
    python3.9
    ```

##### Eliminaciones
<a name="w2aac25c13b5b5c69b9"></a>
+ [Se ha eliminado la versión CUDA11 .0-11.1 de/usr/local/cuda-11.x/, ya que no están siendo utilizadas por ninguna versión de framework compatible según la política de soporte de frameworks.](support-policy.md)

#### Fecha de lanzamiento: 25 de mayo de 2022
<a name="2022-05-25-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de la AMI:** AWS Deep Learning Base AMI GPU CUDA 11 (Ubuntu 20.04) 20220523

##### Actualizado
<a name="w2aac25c13b5b5c71b5"></a>
+ En esta versión se añade compatibilidad con la nueva instancia de EC2 p4de.24xlarge.
  + `aws-efa-installer`Actualizado a la versión 1.15.2
  + Se ha actualizado `aws-ofi-nccl` a la versión `1.3.0-aws` que incluye la topología de p4de.24xlarge.

#### Fecha de la versión: 25/03/2022
<a name="2022-03-25-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de la AMI:** AWS Deep Learning Base AMI GPU CUDA 11 (Ubuntu 20.04) 20220325

##### Actualizado
<a name="w2aac25c13b5b5c73b5"></a>
+ Se ha actualizado la versión de EFA de 1.15.0 a 1.15.1.

#### Fecha de la versión: 17/03/2022
<a name="2022-03-17-base-gpu-ami-ubuntu-20.04"></a>

**Nombre de la AMI:** AWS Deep Learning Base AMI GPU CUDA 11 (Ubuntu 20.04) 20220323

##### Added
<a name="w2aac25c13b5b5c75b5"></a>
+ Primera versión