GPU AMI de aprendizado profundo TensorFlow 2.17 (Ubuntu 22.04) - AMIs de deep learning da AWS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

GPU AMI de aprendizado profundo TensorFlow 2.17 (Ubuntu 22.04)

Para obter ajuda para começar, consulteConceitos básicos da DLAMI.

Formato de nome da AMI

  • Driver OSS Nvidia de aprendizado profundo AMI GPU TensorFlow 2.17 (Ubuntu 22.04) $ {AAAA-MM-DD}

EC2 Instâncias suportadas

  • Aprendizado profundo com OSS O driver Nvidia suporta G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e. 5caneta.

A AMI inclui o seguinte:

  • AWS Serviço suportado: Amazon EC2

  • Sistema operacional: Ubuntu 22.04

  • Arquitetura de computação: x86

  • Python:/3.12 opt/tensorflow/bin/python

  • TensorFlow versão: 2.17

  • Controlador NVIDIA

    • Driver OSS Nvidia: 570.172.08

  • Pilha NVIDIA CUDA12 :

    • Caminho de instalação de CUDA, NCCL e cuDDN:/-12.3/ usr/local/cuda

  • Instalador EFA: 1.34.0

  • AWS CLI v2 como aws2 e AWS CLI v1 como aws

  • Tipo de volume do EBS: gp3

  • Consulte o AMI-ID com o parâmetro SSM (a região do exemplo é us-east-1):

    • Controlador OSS Nvidia:

      aws ssm get-parameter --region us-east-1 \ --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.17-ubuntu-22.04/latest/ami-id \ --query "Parameter.Value" \ --output text
  • Consulte o AMI-ID com AWSCLI (a região de exemplo é us-east-1):

    • Controlador OSS Nvidia:

      aws ec2 describe-images --region us-east-1 \ --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.17 (Ubuntu 22.04) ????????' 'Name=state,Values=available' \ --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \ --output text

Data de lançamento: 2025-02-17

Nome da AMI: Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 20250215

Atualizado

  • Kit de ferramentas de contêiner NVIDIA atualizado da versão 1.17.3 para a versão 1.17.4

    • Consulte a página de notas de lançamento aqui para obter mais informações: https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4

    • Na versão 1.17.4 do Container Toolkit, a montagem das bibliotecas de compatibilidade CUDA agora está desativada. Para garantir a compatibilidade com várias versões do CUDA em fluxos de trabalho de contêineres, certifique-se de atualizar seu LD_LIBRARY_PATH para incluir suas bibliotecas de compatibilidade CUDA, conforme mostrado no tutorial Se você usar uma camada de compatibilidade CUDA.

Removido

Data de lançamento: 2025-01-20

Nome da AMI: Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 20250118

Atualizado

Versão 2.17.1

Data de lançamento: 2024-11-18

Nome da AMI: Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 20241115

Fixo 

  • Devido a uma alteração no kernel do Ubuntu para solucionar um defeito na funcionalidade KASLR (Kernel Address Space Layout Randomization), as instâncias G4Dn/G5 não conseguem inicializar adequadamente o CUDA no driver OSS Nvidia. Para mitigar esse problema, esse DLAMI inclui uma funcionalidade que carrega dinamicamente o driver proprietário para instâncias G4Dn e G5. Aguarde um breve período de inicialização para esse carregamento para garantir que suas instâncias funcionem corretamente.

    • Para verificar o status e a integridade desse serviço, você pode usar os seguintes comandos:

sudo systemctl is-active dynamic_driver_load.service active

Versão 2.17.0

Data de lançamento: 2024-09-25

Nome da AMI: Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.17 (Ubuntu 22.04) 20240924

Adicionado

  • Lançamento inicial da série Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.17 (Ubuntu 22.04).

    • O software inclui o seguinte:

      • “nvidia-driver = 550,90,07"

      • “gerenciador de tecidos = 550,90,07"

      • “cuda = 12,3"

      • “cudnn = 8,9,7"

      • “efa = 1,34,0"

      • “nccl=2.22.3"

      • “aws-nccl-ofi-plugin=v1.11.0-aws”

  • O ambiente virtual Tensorflow (fonte do comando de ativação/opt/tensorflow/bin/activate) inclui o seguinte:

    • “tensorflow = 2.17.0”