

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# AWS AMI de GPU de base de aprendizado profundo (Ubuntu 20.04)
<a name="aws-deep-learning-base-gpu-ami-ubuntu-20.04"></a>

#### Aviso de fim do suporte
<a name="out-of-support-base-gpu-ami-ubuntu-20.04"></a>
+ O Ubuntu Linux 20.04 LTS está chegando ao fim da janela de LTS de cinco anos em 31 de maio de 2025 e não o fornecedor não fornece mais suporte.* *Consequentemente, o AWS Deep Learning Base GPU AMI (Ubuntu 20.04) não terá atualizações após 31 de maio de 2025. As versões anteriores continuarão disponíveis. Observe que qualquer AMI lançada publicamente será descontinuada pelo EC2 após dois anos de sua data de criação. Consulte mais informações em [Descontinuar uma AMI do Amazon EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ami-deprecate.html).
+ Por três meses, até 31 de agosto de 2025, o suporte será fornecido somente para problemas de funcionalidade (não para patches de segurança).
+ Os usuários da DLAMI do Ubuntu 20.04 devem migrar para a [AMI base para aprendizado profundo da AWS com GPU (Ubuntu 22.04)](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-22-04/) ou a [AMI base para aprendizado profundo da AWS com GPU (Ubuntu 24.04)](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-ubuntu-24-04/). Como alternativa, é possível usar a [AMI base de aprendizado profundo da AWS (Amazon Linux 2023)](https://aws.amazon.com/releasenotes/aws-deep-learning-base-gpu-ami-amazon-linux-2023/).

Se precisar de ajuda para começar, consulte [Conceitos básicos da DLAMI](getting-started.md).

#### Formato de nome da AMI
<a name="name-base-gpu-ami-ubuntu-20.04"></a>
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) \$1\$1YYYY-MM-DD\$1
+ AMI base do driver proprietário do Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) \$1\$1YYYY-MM-DD\$1

#### Instâncias do EC2 com suporte
<a name="instances-base-gpu-ami-ubuntu-20.04"></a>
+ Consulte [Alterações importantes no DLAMI](important-changes.md).
+ O aprendizado profundo com driver OSS Nvidia é compatível com G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e e P5en
+ Aprendizado profundo com driver proprietário da Nvidia compatível com G3 (G3.16x incompatível), P3, P3dn

#### A AMI inclui o seguinte:
<a name="contents-base-gpu-ami-ubuntu-20.04"></a>
+ ** AWS Serviço suportado**: Amazon EC2
+ **Sistema operacional**: Ubuntu 20.04
+ **Arquitetura de computação**: x86
+ **A versão mais recente disponível está instalada para os seguintes pacotes:**
  + **Linux Kernel **5.15
  + **FSx Lustre**
  + **Docker**
  + **AWS CLI v2** em/usr/local/bin/aws2 e **AWS CLI v1** em/usr/bin/aws
  + **NVIDIA DCGM**
  + **Nvidia Container Toolkit**:
    + Comando de versão: nvidia-container-cli -V
  + **Nvidia-docker2**:
    + Comando de versão: versão nvidia-docker
+ **Driver NVIDIA**:
  + Driver OSS da NVIDIA: 550.163.01
  + Driver proprietário da Nvidia: 550.163.01
+ **Pilha NVIDIA CUDA 11.7, 12.1-12.4**:
  + Diretórios de instalação CUDA, NCCL e cuDDN:/-xx.x/ usr/local/cuda
    + Exemplo:/usr/local/cuda-12.1/
  + Versão NCCL compilada: 2.22.3\$1 .4 CUDA12
  + **CUDA padrão:** 12.1
    + PATH/usr/local/cudaaponta para **CUDA 12.1**
    + Variáveis de ambiente atualizadas abaixo:
      + LD\$1LIBRARY\$1PATH para ter/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1:/usr/local/cuda-12.1/targets/x86\$164-linux/lib
      + PATH para ter/usr/local/cuda-12.1/bin/:/usr/local/cuda-12.1/include/
      + Para qualquer versão diferente do CUDA, atualize LD\$1LIBRARY\$1PATH adequadamente.
  + **Local dos testes NCCL:**
    + all\$1reduce, all\$1gather e reduce\$1scatter:/-cuda-xx.x/ usr/local/cuda-xx.x/efa/test
    + Para executar testes NCCL, o LD\$1LIBRARY\$1PATH precisa ser aprovado com as atualizações abaixo.
      +  PATHs Os comuns já foram adicionados ao LD\$1LIBRARY\$1PATH:
        + `/opt/amazon/efa/lib:/opt/amazon/openmpi/lib:/opt/aws-ofi-nccl/lib:/usr/local/lib:/usr/lib`
      + Para qualquer versão diferente do CUDA, atualize LD\$1LIBRARY\$1PATH adequadamente.
+ **Instalador do EFA:** 1.39.0
+ **Nvidia GDRCopy: 2.4**
+ **AWS Plugin OFI NCCL**: é instalado como parte do `EFA Installer-aws`
  + AWS O OFI NCCL agora suporta várias versões do NCCL com uma única compilação
  + **Caminho de instalação:**`/opt/aws-ofi-nccl/`. O caminho `/opt/aws-ofi-nccl/lib` é adicionado ao LD\$1LIBRARY\$1PATH.
  + **Testa o caminho** para ring, message\$1transfer: `/opt/aws-ofi-nccl/tests`
+ **Tipo de volume do EBS**: gp3
+ **Python:/3.9** usr/bin/python
+ **NVMe Local do armazenamento de instâncias (em [instâncias EC2 suportadas](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/instance-store-volumes.html#available-instance-store-volumes)):/**opt/dlami/nvme
+ **Consulte o AMI-ID com o parâmetro SSM (a região de exemplo é us-east-1):**
  + **Driver OSS Nvidia**:

    ```
    aws ssm get-parameter --region us-east-1 \
        --name /aws/service/deeplearning/ami/x86_64/base-oss-nvidia-driver-gpu-ubuntu-20.04/latest/ami-id  \
        --query "Parameter.Value" \
        --output text
    ```
  + **Driver proprietário da Nvidia**:

    ```
    aws ssm get-parameter --region us-east-1 \
        --name /aws/service/deeplearning/ami/x86_64/base-proprietary-nvidia-driver-gpu-ubuntu-20.04/latest/ami-id \
        --query "Parameter.Value" \
        --output text
    ```
+ **Consulte o AMI-ID com AWSCLI (a região de exemplo é us-east-1):**
  + **Driver OSS Nvidia**:

    ```
    aws ec2 describe-images --region us-east-1 \
        --owners amazon \
        --filters 'Name=name,Values=Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 20.04) ????????' 'Name=state,Values=available' \
        --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \
        --output text
    ```
  + **Driver proprietário da Nvidia:**

    ```
    aws ec2 describe-images --region us-east-1 \
        --owners amazon \
        --filters 'Name=name,Values=Deep Learning Base Proprietary Nvidia Driver GPU AMI (Ubuntu 20.04) ????????' 'Name=state,Values=available' \
        --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \
        --output text
    ```

#### Notices
<a name="notices-base-gpu-ami-ubuntu-20.04"></a>

**NVIDIA Container Toolkit 1.17.4**

No NVIDIA Container Toolkit versão 1.17.4, a montagem das bibliotecas compatíveis com CUDA agora está desabilitada. Para garantir a compatibilidade com várias versões do CUDA em fluxos de trabalho de contêiner, atualize o LD\$1LIBRARY\$1PATH para incluir as bibliotecas compatíveis com CUDA, conforme mostrado no tutorial [Se você usa uma camada de compatibilidade com CUDA](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat).

**Atualizações do EFA de 1.37 para 1.38 (lançamento em 2025-02-04)**

O EFA agora inclui o plug-in AWS OFI NCCL, que agora pode ser encontrado em `/opt/amazon/ofi-nccl` vez do original. `/opt/aws-ofi-nccl/` Se estiver atualizando sua variável LD\$1LIBRARY\$1PATH, modifique a localização do OFI NCCL corretamente.

**Política de suporte**

Componentes dessa AMI, como as versões do CUDA, podem ser removidos e alterados com base na [política de suporte de framework](support-policy.md) ou para otimizar o desempenho de [contêineres de deep learning](https://aws.amazon.com/machine-learning/containers/) ou para reduzir o tamanho da AMI em uma versão futura, sem aviso prévio. Removemos as versões CUDA AMIs se elas não forem usadas por nenhuma versão de estrutura compatível.

**Instâncias do EC2 com várias placas de rede**
+ Muitos tipos de instâncias que oferecem suporte ao EFA também têm várias placas de rede.
+ DeviceIndex é exclusivo para cada placa de rede e deve ser um número inteiro não negativo menor que o limite de ENIs per. NetworkCard Em P5, o número de ENIs per NetworkCard é 2, o que significa que os únicos valores válidos para DeviceIndex são 0 ou 1.
  + Para a interface de rede primária (índice da placa de rede 0, índice do dispositivo 0), crie uma interface EFA (EFA com ENA). Você não pode usar uma interface de rede exclusiva do EFA como interface de rede primária.
  + Para cada interface de rede adicional, use o próximo índice de placa da rede não utilizado, o índice do dispositivo 1 e uma interface de rede EFA (EFA com ENA) ou somente EFA, dependendo do seu caso de uso, como requisitos de largura de banda do ENA ou espaço de endereço IP. Consulte exemplos de casos de uso na configuração do EFA para instâncias P5.
  + Consulte mais informações no Guia do EFA [aqui](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/efa-acc-inst-types.html).

**Instâncias P5/P5e**
+ As instâncias P5 e P5e contêm 32 placas de interface de rede e podem ser iniciadas usando o seguinte comando: AWS CLI 

```
aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
       ...
      "NetworkCardIndex=31,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"
```

**Instâncias P5en**
+ O P5en contém 16 placas de interface de rede e pode ser iniciado usando o seguinte comando: AWS CLI 

```
aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
       ...
      "NetworkCardIndex=15,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"
```

**Kernel**
+ A versão do kernel é fixa usando o comando:

  ```
  echo linux-aws hold | sudo dpkg —set-selections
  echo linux-headers-aws hold | sudo dpkg —set-selections
  echo linux-image-aws hold | sudo dpkg —set-selections
  ```
+ Recomendamos que os usuários evitem atualizar a versão do kernel (a menos que seja devido a um patch de segurança) para garantir a compatibilidade com os drivers instalados e as versões do pacote. Se os usuários ainda quiserem atualizar, eles poderão executar os seguintes comandos para desafixar suas versões do kernel:

  ```
  echo linux-aws install | sudo dpkg -set-selections
  echo linux-headers-aws install | sudo dpkg -set-selections
  echo linux-image-aws install | sudo dpkg -set-selections
  ```
+ Para cada nova versão da DLAMI, o kernel compatível mais recente disponível é usado.

#### Data de lançamento: 2025-04-24
<a name="2025-04-24-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20250424
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20250424

##### Atualização
<a name="w2aac25c13b5b5c13b5"></a>
+ [Driver Nvidia atualizado da versão 550.144.03 para 550.163.01 para o endereço CVEs presente no boletim de segurança do driver de vídeo GPU NVIDIA de abril de 2025](https://nvidia.custhelp.com/app/answers/detail/a_id/5630)

#### Data de lançamento: 2025-02-17
<a name="2025-02-17-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20250214
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20250214

##### Atualização
<a name="w2aac25c13b5b5c15b5"></a>
+ Atualização do NVIDIA Container Toolkit da versão 1.17.3 para 1.17.4.
  + Consulte a página de notas de lançamento aqui para obter mais informações: [https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4)
  + No NVIDIA Container Toolkit versão 1.17.4, a montagem das bibliotecas compatíveis com CUDA agora está desabilitada. Para garantir a compatibilidade com várias versões do CUDA em fluxos de trabalho de contêiner, atualize o LD\$1LIBRARY\$1PATH para incluir as bibliotecas compatíveis com CUDA, conforme mostrado no tutorial [Se você usa uma camada de compatibilidade com CUDA](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat).

##### Remoção
<a name="w2aac25c13b5b5c15b7"></a>
+ As bibliotecas de espaço do usuário cuobj e nvdisasm foram removidas fornecidas pelo kit de ferramentas [NVIDIA CUDA para abordar as CVEs presentes no boletim de segurança do kit de ferramentas](https://docs.nvidia.com/cuda/) [NVIDIA](https://nvidia.custhelp.com/app/answers/detail/a_id/5594) CUDA de 18 de fevereiro de 2025

#### Data de lançamento: 2025-02-04
<a name="2025-02-04-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20250204
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20250204

##### Atualização
<a name="w2aac25c13b5b5c17b5"></a>
+ Atualização da versão do EFA de 1.37.0 para 1.38.0
  + O EFA agora inclui o plug-in AWS OFI NCCL, que agora pode ser encontrado em `/opt/amazon/ofi-nccl` vez do original. `/opt/aws-ofi-nccl/` Se estiver atualizando sua variável LD\$1LIBRARY\$1PATH, modifique a localização do OFI NCCL corretamente.

##### Remoção
<a name="w2aac25c13b5b5c17b7"></a>
+ O pacote emacs foi removido deles. DLAMIs Os clientes podem instalar o emacs a partir do GNU emacs. [https://www.gnu.org/software/emacs/download.html](https://www.gnu.org/software/emacs/download.html)

#### Data de lançamento: 2025-01-17
<a name="2025-01-17-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20250117
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20250117

##### Atualização
<a name="w2aac25c13b5b5c19b5"></a>
+ [Driver Nvidia atualizado da versão 550.127.05 para 550.144.03 para o endereço CVEs presente no boletim de segurança do driver de vídeo GPU NVIDIA de janeiro de 2025](https://nvidia.custhelp.com/app/answers/detail/a_id/5614)

#### Data de lançamento: 2024-12-09
<a name="2024-12-09-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20241206
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20241206

##### Atualização
<a name="w2aac25c13b5b5c21b5"></a>
+ Atualização do Nvidia Container Toolkit da versão 1.17.0 para 1.17.3

#### Data de lançamento: 2024-11-22
<a name="2024-11-22-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20241122

##### Adição
<a name="w2aac25c13b5b5c23b5"></a>
+ Adição de suporte para instâncias P5en do EC2.

##### Atualização
<a name="w2aac25c13b5b5c23b7"></a>
+ Atualização do instalador do EFA da versão 1.35.0 para 1.37.0
+ Atualize o plug-in AWS OFI NCCL da versão 1.12.1-aws para 1.13.0-aws

#### Data de lançamento: 2024-10-26
<a name="2024-10-26-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20241025
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20241025

##### Atualização
<a name="w2aac25c13b5b5c25b5"></a>
+ [Driver Nvidia atualizado da versão 550.90.07 para 550.127.05 para endereço CVEs presente no Boletim de Segurança do NVIDIA GPU Display de outubro de 2024](https://nvidia.custhelp.com/app/answers/detail/a_id/5586)

#### Data de lançamento: 2024-10-03
<a name="2024-10-03-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240927

##### Atualização
<a name="w2aac25c13b5b5c27b5"></a>
+ Atualização do Nvidia Container Toolkit da versão 1.16.1 para 1.16.2

#### Data de lançamento: 2024-08-27
<a name="2024-09-27-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240827

##### Atualização
<a name="w2aac25c13b5b5c29b5"></a>
+ Atualização do driver Nvidia e Fabric Manager da versão 535.183.01 para 550.90.07
+ Atualização da versão do EFA de 1.32.0 para 1.34.0
+ Atualização do NCCL para a versão mais recente 2.22.3 para todas as versões do CUDA
  + CUDA 11.7 atualizado da versão 2.16.2\$1. CUDA11
  + CUDA 12.1, 12.2 atualizado de 2.18.5\$1 2. CUDA12
  + CUDA 12.3 atualizado da versão 2.21.5\$1 4. CUDA12

##### Adição
<a name="w2aac25c13b5b5c29b7"></a>
+ Foi adicionado o kit de ferramentas CUDA versão 12.4 no diretório/-12.4 usr/local/cuda
+ Adição de suporte para **Instâncias P5e do EC2**.

##### Remoção
<a name="w2aac25c13b5b5c29b9"></a>
+ Removida a pilha do CUDA Toolkit versão 11.8 presente no diretório/-11.8 usr/local/cuda

#### Data de lançamento: 2024-08-19
<a name="2024-08-19-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240816

##### Adição
<a name="w2aac25c13b5b5c31b5"></a>
+ Adição de suporte para a [instância G6e do EC2](https://aws.amazon.com/ec2/instance-types/g6e/).

#### Data de lançamento: 2024-06-06
<a name="2024-06-06-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240606
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240606

##### Atualização
<a name="w2aac25c13b5b5c33b5"></a>
+ Atualização da versão do driver Nvidia para 535.183.01 de 535.161.08

#### Data de lançamento: 2024-05-15
<a name="2024-05-15-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240515
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240515

##### Adição
<a name="w2aac25c13b5b5c35b5"></a>
+ Foi adicionada novamente a pilha CUDA11 .7 no diretório/usr/local/cuda-11.7 com CUDA11 .7, NCCL 2.16.2, cuDNN 8.7.0, pois 1.13 suporta .7 PyTorch CUDA11

#### Data de lançamento: 2024-05-02
<a name="2024-05-02-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240502
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240502

##### Atualização
<a name="w2aac25c13b5b5c37b5"></a>
+ Versão do EFA atualizada de 1.30 para 1.32
+ Plugin AWS OFI NCCL atualizado da versão 1.7.4 para a versão 1.9.1
+ Atualização do Nvidia Container Toolkit da versão 1.13.5 para [1.15.0](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.15.0)
  + **A versão 1.15.0 NÃO inclui os pacotes nvidia-container-runtime nvidia-docker2. É recomendável usar nvidia-container-toolkit pacotes diretamente seguindo os documentos do [kit de ferramentas de contêiner da Nvidia](https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/sample-workload.html).**

##### Adição
<a name="w2aac25c13b5b5c37b7"></a>
+ Foi adicionada uma pilha CUDA12 3.0 com 3.3, NCCL CUDA12 2.21.5, cuDNN 8.9.7

##### Remoção
<a name="w2aac25c13b5b5c37b9"></a>
+ Foram removidas as pilhas de CUDA11 0,7, CUDA12 0,0 presentes nos diretórios//-12.0 usr/local/cuda-11.7 and /usr/local/cuda
+ [https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.15.0](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.15.0) nvidia-container-runtime

#### Data de lançamento: 2024-04-04
<a name="2024-04-04-base-gpu-ami-ubuntu-20.04"></a>

**Nomes da AMI:** AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240404

##### Adição
<a name="w2aac25c13b5b5c39b5"></a>
+ Para DLAMIs do driver OSS Nvidia, foi adicionado suporte às instâncias G6 e Gr6 do EC2. Consulte mais informações em [Instâncias de GPU recomendadas](gpu.md).

#### Data de lançamento: 2024-03-29
<a name="2024-03-29-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240326
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240326

##### Atualização
<a name="w2aac25c13b5b5c41b5"></a>
+ Driver Nvidia atualizado de 535.104.12 para 535.161.08 nos drivers Proprietário e OSS Nvidia. DLAMIs
+ Remoção do suporte para instâncias G4dn e G5 do EC2 da DLAMI do driver proprietário da NVIDIA.
+ As novas instâncias compatíveis com cada DLAMI são as seguintes:
  + Aprendizado profundo com driver proprietário da Nvidia compatível com G3 (G3.16x incompatível), P3, P3dn
  + O aprendizado profundo com driver OSS Nvidia é compatível com G4dn, G5, P4d, P4de e P5.

#### Data de lançamento: 2024-03-20
<a name="2024-03-20-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240318
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240318

##### Adição
<a name="w2aac25c13b5b5c43b5"></a>
+ Adicionado `awscliv2` na AMI em usr/local/bin/aws /2, junto com `awscliv1` usr/bin/aws /na AMI proprietária e OSS Nvidia Driver

#### Data de lançamento: 2024-03-14
<a name="2024-03-14-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240314

##### Atualização
<a name="w2aac25c13b5b5c45b5"></a>
+ A DLAMI do driver OSS Nvidia foi atualizada com suporte para G4dn e G5. Com base nisso, o suporte atual fica assim:
  + A AMI base do driver proprietário da Nvidia para aprendizado profundo (Ubuntu 20.04) é compatível com P3, P3dn, G3, G5 e G4dn.
  + A AMI base do driver OSS Nvidia para aprendizado profundo (Ubuntu 20.04) é compatível com G5, G4dn, P4 e P5.
+ Recomenda-se que o driver DLAMIs OSS Nvidia seja usado para G5, G4dn, P4, P5.

#### Data de lançamento: 2024-02-12
<a name="2024-02-12-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240208
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240208

##### Atualização
<a name="w2aac25c13b5b5c47b5"></a>
+ AWS O plugin OFI NCCL foi atualizado de 1.7.3 para 1.7.4

#### Data de lançamento: 2024-02-01
<a name="2024-02-01-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240201
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20240201

##### Segurança
<a name="w2aac25c13b5b5c49b5"></a>
+ Atualização da versão do pacote runc para consumir o patch para [CVE-2024-21626](https://nvd.nist.gov/vuln/detail/CVE-2024-21626).

#### Data de lançamento: 2023-12-04
<a name="2023-12-04-base-gpu-ami-ubuntu-20.04"></a>

**Nomes de AMI**
+ AMI base do driver OSS Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20231204
+ AMI base do driver proprietário da Nvidia para aprendizado profundo com GPU (Ubuntu 20.04) 20231204

##### Adição
<a name="w2aac25c13b5b5c51b5"></a>
+ AWS A AMI de aprendizado profundo (DLAMI) é dividida em dois grupos separados:
  + DLAMIs que usam driver proprietário da NVIDIA (para oferecer suporte a P3, P3dn, G3, G5 e G4dn).
  + DLAMIs que usam o driver OSS Nvidia para habilitar o EFA (para oferecer suporte a P4 e P5).
+ Consulte mais informações sobre a divisão de DLAMIs em [Alterações importantes na DLAMI](important-changes.md).
+ AWS CLI as consultas acima estão em bullet **Point Query AMI-ID AWSCLI com (exemplo**, a região é us-east-1)

##### Atualização
<a name="w2aac25c13b5b5c51b7"></a>
+ Atualização do EFA de 1.26.1 para 1.29.0
+ GDRCopy atualizado de 2.3 para 2.4

#### Data de lançamento: 2023-10-18
<a name="2023-10-18-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20231018

##### Atualização
<a name="w2aac25c13b5b5c53b5"></a>
+ AWS Plugin OFI NCCL atualizado da versão 1.7.2 para a versão 1.7.3
+ Atualização dos diretórios do CUDA 12.0-12.1 com NCCL versão 2.18.5 para corresponder ao CUDA 12.2
+ CUDA12.1 atualizado como a versão padrão do CUDA
  + LD\$1LIBRARY\$1PATH atualizado para ter//usr/local/cuda-12.1/targets/x86\$164-linux/lib/:/usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1 and PATH to have /usr/local/cuda-12.1/bin
  + Para clientes que desejam mudar para qualquer versão diferente do CUDA, defina as variáveis LD\$1LIBRARY\$1PATH e PATH adequadamente.

#### Data de lançamento: 2023-10-02
<a name="2023-10-02-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20231002

##### Atualização
<a name="w2aac25c13b5b5c55b5"></a>
+ Atualização do driver NVIDIA de 535.54.03 para 535.104.12
  + Esse driver mais recente corrige as alterações importantes da ABI do NVML encontradas na versão 535.54.03 do driver, bem como a regressão do driver encontrada na versão 535.86.10 que afetou CUDA Toolkits nas instâncias P5. Consulte as seguintes notas de versão da NVIDIA para obter detalhes sobre as correções:
  + Consulte as seguintes notas de versão da NVIDIA para obter detalhes sobre as correções:
    + [4235941](https://docs.nvidia.com/datacenter/tesla/tesla-release-notes-535-104-05/index.html): correção de alteração incompatível na ABI do NVML
    + [4228552](https://docs.nvidia.com/datacenter/tesla/tesla-release-notes-535-104-12/index.html) : correção de erro do CUDA Toolkit
+ Atualização de diretórios do CUDA 12.2 com NCCL 2.18.5
+ Atualização do EFA da versão 1.24.1 para a mais recente 1.26.1

##### Adição
<a name="w2aac25c13b5b5c55b7"></a>
+ Adicionado CUDA12 1.2 em usr/local/cuda /-12.2

##### Remoção
<a name="w2aac25c13b5b5c55b9"></a>
+ Remoção de suporte do CUDA 11.5 e CUDA 11.6

#### Data de lançamento: 2023-09-26
<a name="2023-09-26-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20230926

##### Adição
<a name="w2aac25c13b5b5c57b5"></a>
+ Inclusão de alterações em net.naming-scheme para corrigir o problema de nomenclatura imprevisível da interface de rede ([link](https://bugs.launchpad.net/ubuntu/+source/systemd/+bug/1945225)) observado na P5. Essa alteração é feita definindo net.naming-scheme=v247 nos argumentos de inicialização do linux no arquivo/etc/default/grub

#### Data de lançamento: 2023-08-30
<a name="2023-08-30-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20230830

##### Atualização
<a name="w2aac25c13b5b5c59b5"></a>
+ `aws-ofi-nccl`Plugin atualizado de v1.7.1 para v1.7.2

#### Data de lançamento: 2023-08-11
<a name="2023-08-11-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20230811

##### Adição
<a name="w2aac25c13b5b5c61b5"></a>
+ Essa AMI agora fornece suporte para a funcionalidade de treinamento de vários nós na P5 e em todas as instâncias do EC2 compatíveis anteriormente.
+ Para a instância P5 EC2, recomenda-se que o NCCL 2.18 seja usado e foi adicionado a .0 e .1. CUDA12 CUDA12

##### Remoção
<a name="w2aac25c13b5b5c61b7"></a>
+ Suporte removido para CUDA11 .3 e CUDA11 .4.

#### Data de lançamento: 2023-08-04
<a name="2023-08-04-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20230804

##### Atualização
<a name="w2aac25c13b5b5c63b5"></a>
+ Plugin AWS OFI NCCL atualizado para v1.7.1
+ Tornado o CUDA11.8 como padrão, pois PyTorch 2.0 suporta 11.8 e, para a instância P5 EC2, é recomendável usar >= .8 CUDA11
  + LD\$1LIBRARY\$1PATH atualizado para ter//usr/local/cuda-11.8/targets/x86\$164-linux/lib/:/usr/local/cuda-11.8/lib:/usr/local/cuda-11.8/lib64:/usr/local/cuda-11.8 and PATH to have /usr/local/cuda-11.8/bin
  + Para qualquer versão diferente do CUDA, defina LD\$1LIBRARY\$1PATH adequadamente.
+ Atualização de diretórios do CUDA 12.0 e 12.1 com NCCL 2.18.3

##### Fixo
<a name="w2aac25c13b5b5c63b7"></a>
+ Correção do problema de carregamento do pacote Nvidia Fabric Manager (FM) mencionado na data de lançamento anterior de** **2023-07-19.

#### Data de lançamento: 2023-07-19
<a name="2023-07-19-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20230719

##### Atualização
<a name="w2aac25c13b5b5c65b5"></a>
+ Atualização do EFA de 1.22.1 para 1.24.1
+ Atualização do driver Nvidia de 525.85.12 para 535.54.03

##### Adição
<a name="w2aac25c13b5b5c65b7"></a>
+ Foram adicionadas alterações no estado c para desativar o estado ocioso do processador, definindo o estado c máximo como C1. Essa alteração é feita definindo `intel\$1idle.max\$1cstate=1 processor.max\$1cstate=1` nos argumentos de inicialização do linux no arquivo/etc/default/grub
+ AWS Suporte à instância EC2 P5:
  + Adição de suporte à instância P5 do EC2 para fluxos de trabalho usando um único nó/instância. O suporte a vários nós (por exemplo, para treinamento em vários nós) usando o EFA (Elastic Fabric Adapter) e o plug-in AWS OFI NCCL será adicionado em uma versão futura.
  + Use CUDA>=11.8 para um desempenho ideal.
  + Problema conhecido: o pacote Nvidia Fabric Manager (FM) leva tempo para carregar na P5. Os clientes precisam esperar de dois a três minutos até que o FM seja carregado após iniciar a instância P5. Para verificar se o FM foi iniciado, execute o comando sudo systemctl is-active nvidia-fabricmanager. Ele deverá retornar ativo antes de iniciar qualquer fluxo de trabalho. Isso será aprimorado em uma próxima versão.

#### Data de lançamento: 2023-05-19
<a name="2023-05-19-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20230519

##### Atualização
<a name="w2aac25c13b5b5c67b5"></a>
+ Atualização do EFA para a versão mais recente 1.22.1
+ Atualização da versão do NCCL do CUDA 12.1 para 2.17.1

##### Adição
<a name="w2aac25c13b5b5c67b7"></a>
+ Adicionado CUDA12 4.1 em//usr/local/cuda-12.1
+ Adicionado suporte para [NVIDIA Data Center GPU Monitor (DCGM](https://developer.nvidia.com/dcgm)) por meio do pacote datacenter-gpu-manager
  + É possível verificar o status desse serviço por meio da seguinte consulta: sudo systemctl status nvidia-dcgm
+ Os armazenamentos temporários de instâncias NVMe agora são montados automaticamente nas instâncias EC2 suportadas e o armazenamento pode ser acessado na pasta//. opt/dlami/nvme É possível verificar ou modificar este serviço das seguintes maneiras:
  + Verifique o status do NVMe serviço: sudo systemctl status dlami-nvme
  + Para acessar ou modificar o serviço: `/opt/aws/dlami/bin/nvme_ephemeral_drives.sh`
+ NVMe os volumes forneceram as soluções de armazenamento mais rápidas e eficientes para fluxos de trabalho de alto rendimento que exigem desempenho de IOPS. Armazenamentos de NVMe instâncias efêmeras estão incluídos no custo das instâncias, portanto, não há custo adicional incorrido com esse serviço.
+ Os armazenamentos de instâncias NVMe só serão montados em instâncias do EC2 compatíveis. Para obter informações sobre instâncias do EC2 com armazenamentos de instâncias NVMe compatíveis, consulte [Volumes de armazenamento de instâncias disponíveis](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/instance-store-volumes.html#available-instance-store-volumes) e valide se NVMe há suporte.
+ Para melhorar o desempenho do disco e reduzir as penalidades de primeira gravação, inicialize os armazenamentos de instâncias (observe que esse processo pode levar horas, dependendo do tipo de instância do EC2): [Inicializar os volumes de armazenamento de instância em instâncias do EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/disk-performance.html)
+ **OBSERVAÇÃO**: os armazenamentos de NVMe instâncias são montados na instância e não estão conectados à rede, como o EBS. Os dados nesses NVMe volumes podem ser perdidos na reinicialização ou interrupção da sua instância.

#### Data de lançamento: 2023-04-17
<a name="2023-04-17-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** AMI base para aprendizado profundo com GPU (Ubuntu 20.04) 20230414

##### Atualização
<a name="w2aac25c13b5b5c69b5"></a>
+ Nome DLAMI atualizado AWS do Deep Learning Base AMI GPU CUDA 11 (Ubuntu 20.04) \$1 \$1YYY-MM-DD\$1 para o Deep Learning Base GPU AMI (Ubuntu 20.04) \$1 \$1YYYY-MM-DD\$1
  + Observe que ofereceremos suporte à DLAMI mais recente com o nome antigo da AMI por um mês a partir desta versão, caso seja necessário. Os clientes podem atualizar os pacotes do sistema operacional usando apt-get update && apt-get upgrade para receber os patches de segurança.
+ Caminho do plugin AWS OFI NCCL atualizado de para `/usr/local/cuda-xx.x/efa/` `/opt/aws-ofi-nccl/`
+ A NCCL foi atualizada para uma [ramificação GIT personalizada da v2.16.2,](https://github.com/NVIDIA/nccl/tree/inc_nsteps) com coautoria de uma equipe da NCCL para todas as versões do CUDA. AWS Ele tem um desempenho melhor na AWS infraestrutura.

##### Adição
<a name="w2aac25c13b5b5c69b7"></a>
+ Adicionado CUDA12 4.0 em usr/local/cuda /-12.0
+ [AWS FSx](https://aws.amazon.com/fsx/) adicionado
+ Adicionado suporte para Python versão 3.9 em /3.9 usr/bin/python
  + Observe que essa alteração não substitui o sistema padrão Python, python3 ainda direcionará ao sistema Python3.8.
  + O Python3.9 pode ser acessado utilizando os seguintes comandos:

    ```
    /usr/bin/python3.9
    python3.9
    ```

##### Remoção
<a name="w2aac25c13b5b5c69b9"></a>
+ [Os CUDA11 .0-11.1 de/usr/local/cuda-11.x/ foram removidos, pois eles não estão sendo usados por nenhuma versão de estrutura compatível com base na política de suporte da estrutura.](support-policy.md)

#### Data de lançamento: 2022-05-25
<a name="2022-05-25-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** Base de aprendizado AWS profundo AMI GPU CUDA 11 (Ubuntu 20.04) 20220523

##### Atualização
<a name="w2aac25c13b5b5c71b5"></a>
+ Esta versão adiciona suporte à nova instância p4de.24xlarge do EC2.
  + Atualizado `aws-efa-installer` para a versão 1.15.2
  + Atualizado `aws-ofi-nccl` para a versão `1.3.0-aws` que inclui a topologia para p4de.24xlarge.

#### Data de lançamento: 2022-03-25
<a name="2022-03-25-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** Base de aprendizado AWS profundo AMI GPU CUDA 11 (Ubuntu 20.04) 20220325

##### Atualização
<a name="w2aac25c13b5b5c73b5"></a>
+ Atualização da versão do EFA de 1.15.0 para 1.15.1

#### Data de lançamento: 2022-03-17
<a name="2022-03-17-base-gpu-ami-ubuntu-20.04"></a>

**Nome da AMI:** Base de aprendizado AWS profundo AMI GPU CUDA 11 (Ubuntu 20.04) 20220323

##### Adição
<a name="w2aac25c13b5b5c75b5"></a>
+ Primeira versão