AWS Processeur graphique AMI TensorFlow 2.16 pour apprentissage profond (Amazon Linux 2) - AWS Apprentissage profond (deep learning) AMIs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

AWS Processeur graphique AMI TensorFlow 2.16 pour apprentissage profond (Amazon Linux 2)

Pour obtenir de l'aide pour démarrer, consultezCommencer à utiliser le DLAMI.

Format du nom de l'AMI

  • Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) $ {YYYY-MM-DD}

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) $ {YYYY-MM-DD}

EC2 Instances prises en charge

  • Reportez-vous à la section Modifications importantes apportées au DLAMI.

  • Apprentissage profond avec OSS Le pilote Nvidia prend en charge les modèles G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en.

  • Le Deep Learning avec pilote propriétaire Nvidia prend en charge les formats G3 (G3.16x non pris en charge), P3, P3dn

L'AMI inclut les éléments suivants :

  • AWS Service pris en charge : EC2

  • Système d'exploitation : Amazon Linux 2

  • Architecture de calcul : x86

  • Python :/ opt/tensorflow/bin/python 3.10

  • TensorFlow version : 2.16

  • Pilote NVIDIA :

    • Pilote OSS Nvidia : 550.144.03

    • Pilote Nvidia propriétaire : 550.144.03

  • CUDA12 Stack NVIDIA :

    • Chemin d'installation de CUDA, NCCL et CudDN :/-12.2/ usr/local/cuda

  • Installateur EFA : 1.34.0

  • AWS CLI v2 en tant qu'aws2 et AWS CLI v1 en tant qu'aws

  • Type de volume EBS : GP3

  • Requête AMI-ID avec le paramètre SSM (exemple de région : us-east-1) :

    • Pilote OSS Nvidia :

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
    • Pilote Nvidia propriétaire :

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
  • Requête AMI-ID avec AWSCLI (exemple de région : us-east-1) :

    • Pilote OSS Nvidia :

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • Pilote Nvidia propriétaire :

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

Notice (Avis)

Boîte à outils NVIDIA Container 1.17.4

Dans la version 1.17.4 de Container Toolkit, le montage des bibliothèques de compatibilité CUDA est désormais désactivé. Afin de garantir la compatibilité avec plusieurs versions de CUDA sur les flux de travail de conteneurs, assurez-vous de mettre à jour votre LD_LIBRARY_PATH pour inclure vos bibliothèques de compatibilité CUDA, comme indiqué dans le didacticiel « Si vous utilisez une couche de compatibilité CUDA » ici - -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat

Mises à jour futures du système TensorFlow d'exploitation

TensorFlow 2.16 sera le dernier DLAMI utilisant le système d'exploitation Ubuntu 20.04. À partir de la TensorFlow version 2.17 et supérieure, DLAMIs vous commencerez à utiliser Ubuntu 22.04 comme système d'exploitation de base. Pour les clients qui souhaitent passer à ces nouvelles versions, assurez-vous que vos flux de travail sont prêts pour cette mise à niveau.

Version de Keras épinglée à 2.0 au lieu de 3.0

Avec la dernière version TF2 1.6, Keras est passé de la version majeure 2 à la version majeure 3.0. Cette version de Keras est une réécriture complète du package Keras (veuillez consulter la documentation de Keras 3 pour plus d'informations). Pour garantir la compatibilité avec les flux de travail des clients, nous avons épinglé les versions de Keras à 2.0 en utilisant la variable d'environnement TF_USE_LEGACY_KERAS=1. Si vos flux de travail nécessitent l'utilisation de Keras 3.0, veuillez supprimer cette variable d'environnement de votre environnement TensorFlow virtuel /opt/tensorflow à l'aide du script suivant :

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS

Date de sortie : 2025-02-17

Noms des AMI :

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215

  • Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20250215

Mis à jour
Supprimé

Date de sortie : 2025-01-20

Noms des AMI :

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250120

  • Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20250118

Mis à jour

Date de sortie : 2024-10-23

Noms des AMI :

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241022

  • Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20241023

Mis à jour

Date de sortie : 2024-09-28

Noms des AMI :

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928

  • Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20240928

Mis à jour

Date de sortie : 2024-09-21

Noms des AMI :

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921

  • Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20240921

Mis à jour
  • Mise à niveau du pilote Nvidia et du Fabric Manager de la version 535.183.01 à la version 550.90.07

  • Version EFA mise à niveau de la version 1.32.0 à la version 1.34.0

  • PyTorch Version mise à jour de la version 2.3.0 à la version 2.3.1

Ajouté
  • Ajout du support pour l' EC2 instance P5e sur OSS Nvidia Driver Images.

Date de sortie : 2024-08-19

Noms des AMI :

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240817

Ajouté

Version 2.16.2 - Date de sortie : 26/07/2022

Noms des AMI :

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240725

Mis à jour
  • Version de TensorFlow correctif mise à jour de la version 2.16.1 à la version 2.16.2

  • Résolution d'une version TensorFlow mineure incorrecte dans le DLAMI publiée le 17/07/2021

    • La version 20240717 de Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) contenait par inadvertance la version TensorFlow mineure 2.17 au lieu de la version 2.16. Assurez-vous que les flux de travail basés sur la version TensorFlow 2.16 sont mis à niveau vers le dernier DLAMI.

Version 2.16.1 - Date de sortie : 10/06/2022

Noms des AMI :

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240607

  • Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20240610

Mis à jour
  • Version du pilote Nvidia mise à jour vers 535.183.01 à partir de 535.161.08

Date de sortie : 2024-05-10

Reportez-vous à la section Modifications importantes apportées au DLAMI

Noms des AMI :

  • Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20240510

  • Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510

Ajouté
  • Version initiale de :

    • Processeur graphique AMI propriétaire Nvidia Driver, série TensorFlow 2.16 (Amazon Linux 2) pour le Deep Learning.

    • Deep Learning OSS Nvidia Driver AMI, série TensorFlow 2.16 (Amazon Linux 2).

    • Le logiciel inclut les éléments suivants :

      • « nvidia-driver=535,161,08 »

      • « fabric-manager=535,161,08 »

      • « cuda = 12,3 »

      • « cudnn=8,9,7"

      • « efa=1,32,0 »

      • « nccl=2,21,5 »

      • « aws-nccl-ofi-plugin =v1.9.1-aws »

  • Ajout de l'environnement virtuel Tensorflow (source de commande d'activation/opt/tensorflow/bin/activate). Cet environnement inclut les éléments suivants :

    • « tensorflow=2,16.1 »

    • REMARQUE

      • À partir de la TF2 version .16, l'API tf.estimator est supprimée.

      • Pour garantir la compatibilité avec les flux de travail des clients, nous avons épinglé les versions de Keras à 2.0 en utilisant la variable d'environnement TF_USE_LEGACY_KERAS=1. Si vos flux de travail nécessitent l'utilisation de Keras 3.0, veuillez supprimer cette variable d'environnement de votre environnement TensorFlow virtuel /opt/tensorflow à l'aide du script suivant :

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS