GPU AMI d'apprentissage profond TensorFlow 2.18 (Ubuntu 22.04) - AWS Apprentissage profond (deep learning) AMIs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

GPU AMI d'apprentissage profond TensorFlow 2.18 (Ubuntu 22.04)

Pour obtenir de l'aide pour démarrer, consultezCommencer à utiliser le DLAMI.

Format du nom de l'AMI

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) $ {YYYY-MM-DD}

EC2 Instances prises en charge

  • Apprentissage profond avec OSS Le pilote Nvidia prend en charge les modèles G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en.

L'AMI inclut les éléments suivants :

  • AWS Service pris en charge : Amazon EC2

  • Système d'exploitation : Ubuntu 22.04

  • Architecture informatique : x86

  • Python :/ opt/tensorflow/bin/python 3,12

  • TensorFlow version : 2.18

  • Pilote NVIDIA :

    • Pilote OSS Nvidia : 570.172.08

  • CUDA12 Stack NVIDIA :

    • Chemin d'installation de CUDA, NCCL et CudDN :/-12.5/ usr/local/cuda

  • Installateur EFA : 1.43.1

  • AWS CLI v2 en tant qu'aws2 et AWS CLI v1 en tant qu'aws

  • Type de volume EBS : GP3

  • Requête AMI-ID avec le paramètre SSM (exemple : la région est us-east-1) :

    • Pilote OSS Nvidia :

      aws ssm get-parameter --region us-east-1 \ --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.18-ubuntu-22.04/latest/ami-id \ --query "Parameter.Value" \ --output text
  • Interrogez l'AMI-ID avec AWSCLI (par exemple, la région est us-east-1) :

    • Pilote OSS Nvidia :

      aws ec2 describe-images --region us-east-1 \ --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) ????????' 'Name=state,Values=available' \ --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \ --output text

Date de sortie : 2025-02-17

Nom de l'AMI : Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20250215

Mis à jour

  • Mise à jour de NVIDIA Container Toolkit de la version 1.17.3 à la version 1.17.4

    • Consultez la page des notes de publication ici pour plus d'informations : https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4

    • Dans la version 1.17.4 de Container Toolkit, le montage des bibliothèques de compatibilité CUDA est désormais désactivé. Afin de garantir la compatibilité avec plusieurs versions de CUDA sur les flux de travail de conteneurs, veillez à mettre à jour votre LD_LIBRARY_PATH pour inclure vos bibliothèques de compatibilité CUDA, comme indiqué dans le didacticiel Si vous utilisez une couche de compatibilité CUDA.

Supprimé

Date de sortie : 2025-01-20

Nom de l'AMI : Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20250118

Mis à jour

  • Mise à niveau du pilote Nvidia de la version 550.90.07 à la version 550.127.05 pour corriger un problème CVEs présent dans le bulletin de sécurité du pilote d'affichage pour GPU NVIDIA de janvier 2025

Date de sortie : 2024-12-09

Nom de l'AMI : Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20241206

Ajouté

  • Version initiale de la série Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04).

    • Le logiciel inclut les éléments suivants :

      • « nvidia-driver=550,127,05 »

      • « fabric-manager=550,127,05 »

      • « cuda = 12,5 »

      • « cudnn=9.5.1 »

      • « efa=1,37,0 »

      • « nccl=2,23,4 »

      • « aws-nccl-ofi-plugin =v1.13.0-aws »

  • L'environnement virtuel Tensorflow (source de commande d'activation/opt/tensorflow/bin/activate) inclut les éléments suivants :

    • « tensorflow=2,18,0 »

Fixe

  • En raison d'une modification apportée au noyau Ubuntu pour corriger un défaut de la fonctionnalité KASLR (Kernel Address Space Layout Randomization), les instances G4Dn/G5 ne sont pas en mesure d'initialiser correctement CUDA sur le pilote OSS Nvidia. Afin d'atténuer ce problème, ce DLAMI inclut une fonctionnalité qui charge dynamiquement le pilote propriétaire pour les instances G4Dn et G5. Veuillez prévoir une brève période d'initialisation pour ce chargement afin de garantir le bon fonctionnement de vos instances.

    • Pour vérifier l'état et l'intégrité de ce service, vous pouvez utiliser les commandes suivantes :

sudo systemctl is-active dynamic_driver_load.service active