Arquivos de notas de versão - AMIs de deep learning da AWS

Arquivos de notas de versão

Data de lançamento: 2025-02-17

Nome da AMI: AMI do driver OSS Nvidia para aprendizado profundo com GPU TensorFlow 2.18 (Ubuntu 22.04) 20250215

Atualização
Remoção
Data de lançamento: 2025-01-20

Nome da AMI: AMI do driver OSS Nvidia para aprendizado profundo com GPU TensorFlow 2.18 (Ubuntu 22.04) 20250118

Atualização
Data de lançamento: 2024-12-09

Nome da AMI: AMI do driver OSS Nvidia para aprendizado profundo com GPU TensorFlow 2.18 (Ubuntu 22.04) 20241206

Adição
  • Lançamento inicial da série da AMI para aprendizado profundo do driver OSS Nvidia com GPU TensorFlow 2.18 (Ubuntu 22.04).

    • O software inclui o seguinte:

      • "nvidia-driver=550.127.05"

      • "fabric-manager=550.127.05"

      • "cuda=12.5"

      • "cudnn=9.5.1"

      • "efa=1.37.0"

      • "nccl=2.23.4"

      • "aws-nccl-ofi-plugin=v1.13.0-aws"

  • O ambiente virtual do TensorFlow (origem do comando de ativação /opt/tensorflow/bin/activate) inclui o seguinte:

    • "tensorflow=2.18.0"

Fixed
  • Devido a uma alteração no kernel do Ubuntu para solucionar defeitos na funcionalidade de Randomização do Layout do Espaço de Endereçamento do Kernel (KASLR), as instâncias G4Dn/G5 não conseguem inicializar corretamente o CUDA no driver OSS Nvidia. Para mitigar esse problema, esse DLAMI inclui uma funcionalidade que carrega dinamicamente o driver proprietário para instâncias G4Dn e G5. Aguarde um breve período de inicialização desse carregamento para garantir que as instâncias funcionem corretamente.

    • Para conferir o status e a integridade desse serviço, use estes comandos:

sudo systemctl is-active dynamic_driver_load.service active