Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
AWS Processeur graphique AMI TensorFlow 2.16 pour apprentissage profond (Amazon Linux 2)
Pour obtenir de l'aide pour démarrer, consultezCommencer à utiliser le DLAMI.
Format du nom de l'AMI
Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) $ {YYYY-MM-DD}
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) $ {YYYY-MM-DD}
EC2 Instances prises en charge
Reportez-vous à la section Modifications importantes apportées au DLAMI.
Apprentissage profond avec OSS Le pilote Nvidia prend en charge les modèles G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en.
Le Deep Learning avec pilote propriétaire Nvidia prend en charge les formats G3 (G3.16x non pris en charge), P3, P3dn
L'AMI inclut les éléments suivants :
AWS Service pris en charge : EC2
Système d'exploitation : Amazon Linux 2
Architecture de calcul : x86
Python :/ opt/tensorflow/bin/python 3.10
TensorFlow version : 2.16
Pilote NVIDIA :
Pilote OSS Nvidia : 550.144.03
Pilote Nvidia propriétaire : 550.144.03
CUDA12 Stack NVIDIA :
Chemin d'installation de CUDA, NCCL et CudDN :/-12.2/ usr/local/cuda
Installateur EFA : 1.34.0
AWS CLI v2 en tant qu'aws2 et AWS CLI v1 en tant qu'aws
Type de volume EBS : GP3
Requête AMI-ID avec le paramètre SSM (exemple de région : us-east-1) :
Pilote OSS Nvidia :
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output textPilote Nvidia propriétaire :
aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-amazon-linux-2/latest/ami-id --region us-east-1 --query "Parameter.Value" --output text
Requête AMI-ID avec AWSCLI (exemple de région : us-east-1) :
Pilote OSS Nvidia :
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output textPilote Nvidia propriétaire :
aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
Notice (Avis)
Boîte à outils NVIDIA Container 1.17.4
Dans la version 1.17.4 de Container Toolkit, le montage des bibliothèques de compatibilité CUDA est désormais désactivé. Afin de garantir la compatibilité avec plusieurs versions de CUDA sur les flux de travail de conteneurs, assurez-vous de mettre à jour votre LD_LIBRARY_PATH pour inclure vos bibliothèques de compatibilité CUDA, comme indiqué dans le didacticiel « Si vous utilisez une couche de compatibilité CUDA » ici - -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat
Mises à jour futures du système TensorFlow d'exploitation
TensorFlow 2.16 sera le dernier DLAMI utilisant le système d'exploitation Ubuntu 20.04. À partir de la TensorFlow version 2.17 et supérieure, DLAMIs vous commencerez à utiliser Ubuntu 22.04 comme système d'exploitation de base. Pour les clients qui souhaitent passer à ces nouvelles versions, assurez-vous que vos flux de travail sont prêts pour cette mise à niveau.
Version de Keras épinglée à 2.0 au lieu de 3.0
Avec la dernière version TF2 1.6, Keras est passé de la version majeure 2 à la version majeure 3.0. Cette version de Keras est une réécriture complète du package Keras (veuillez consulter la documentation de Keras 3
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS
Date de sortie : 2025-02-17
Noms des AMI :
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250215
Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20250215
Mis à jour
Mise à jour de NVIDIA Container Toolkit de la version 1.17.3 à la version 1.17.4
Consultez la page des notes de publication ici pour plus d'informations : https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
Dans la version 1.17.4 de Container Toolkit, le montage des bibliothèques de compatibilité CUDA est désormais désactivé. Afin de garantir la compatibilité avec plusieurs versions de CUDA sur les flux de travail de conteneurs, assurez-vous de mettre à jour votre LD_LIBRARY_PATH pour inclure vos bibliothèques de compatibilité CUDA, comme indiqué dans le didacticiel « Si vous utilisez une couche de compatibilité CUDA » ici - -gpu-drivers.html# https://docs.aws.amazon.com/sagemaker/ latest/dg/inference collapsible-cuda-compat
Supprimé
Suppression des bibliothèques d'espace utilisateur cuobj et nvdisasm fournies par le kit d'outils NVIDIA CUDA pour remédier aux problèmes
CVE présents dans le bulletin de sécurité du kit NVIDIA CUDA du 18 février 2025
Date de sortie : 2025-01-20
Noms des AMI :
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20250120
Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20250118
Mis à jour
Date de sortie : 2024-10-23
Noms des AMI :
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20241022
Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20241023
Mis à jour
Date de sortie : 2024-09-28
Noms des AMI :
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240928
Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20240928
Mis à jour
Date de sortie : 2024-09-21
Noms des AMI :
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240921
Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20240921
Mis à jour
Mise à niveau du pilote Nvidia et du Fabric Manager de la version 535.183.01 à la version 550.90.07
Version EFA mise à niveau de la version 1.32.0 à la version 1.34.0
PyTorch Version mise à jour de la version 2.3.0 à la version 2.3.1
Ajouté
Ajout du support pour l' EC2 instance P5e sur OSS Nvidia Driver Images.
Date de sortie : 2024-08-19
Noms des AMI :
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240817
Ajouté
Ajout du support pour l' EC2 instance G6e
.
Version 2.16.2 - Date de sortie : 26/07/2022
Noms des AMI :
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240725
Mis à jour
Version de TensorFlow correctif mise à jour de la version 2.16.1 à la version 2.16.2
Résolution d'une version TensorFlow mineure incorrecte dans le DLAMI publiée le 17/07/2021
La version 20240717 de Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) contenait par inadvertance la version TensorFlow mineure 2.17 au lieu de la version 2.16. Assurez-vous que les flux de travail basés sur la version TensorFlow 2.16 sont mis à niveau vers le dernier DLAMI.
Version 2.16.1 - Date de sortie : 10/06/2022
Noms des AMI :
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240607
Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20240610
Mis à jour
Version du pilote Nvidia mise à jour vers 535.183.01 à partir de 535.161.08
Date de sortie : 2024-05-10
Reportez-vous à la section Modifications importantes apportées au DLAMI
Noms des AMI :
Pilote Nvidia AMI propriétaire pour apprentissage profond (GPU TensorFlow 2.16) (Amazon Linux 2) 20240510
Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Amazon Linux 2) 20240510
Ajouté
Version initiale de :
Processeur graphique AMI propriétaire Nvidia Driver, série TensorFlow 2.16 (Amazon Linux 2) pour le Deep Learning.
Deep Learning OSS Nvidia Driver AMI, série TensorFlow 2.16 (Amazon Linux 2).
Le logiciel inclut les éléments suivants :
« nvidia-driver=535,161,08 »
« fabric-manager=535,161,08 »
« cuda = 12,3 »
« cudnn=8,9,7"
« efa=1,32,0 »
« nccl=2,21,5 »
« aws-nccl-ofi-plugin =v1.9.1-aws »
Ajout de l'environnement virtuel Tensorflow (source de commande d'activation/opt/tensorflow/bin/activate). Cet environnement inclut les éléments suivants :
« tensorflow=2,16.1 »
REMARQUE
À partir de la TF2 version .16, l'API tf.estimator est supprimée.
Pour continuer à utiliser tf.estimator, vous devez utiliser TF 2.15 ou une version antérieure. Consultez les notes de mise à jour de la version TensorFlow 2.16.1
pour plus d'informations
Pour garantir la compatibilité avec les flux de travail des clients, nous avons épinglé les versions de Keras à 2.0 en utilisant la variable d'environnement TF_USE_LEGACY_KERAS=1. Si vos flux de travail nécessitent l'utilisation de Keras 3.0, veuillez supprimer cette variable d'environnement de votre environnement TensorFlow virtuel /opt/tensorflow à l'aide du script suivant :
source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS