Deep-Learning-AMI-GPU TensorFlow 2.18 (Ubuntu 22.04) - AWS Deep Learning AMIs

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Deep-Learning-AMI-GPU TensorFlow 2.18 (Ubuntu 22.04)

Hilfe zu den ersten Schritten finden Sie unter. Erste Schritte mit DLAMI

AMI-Namensformat

  • Deep Learning OSS Nvidia-Treiber AMI GPU TensorFlow 2.18 (Ubuntu 22.04) $ {YYYY-MM-DD}

EC2 Unterstützte Instanzen

  • Deep Learning mit OSS Der Nvidia-Treiber unterstützt G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en.

Das AMI umfasst Folgendes:

  • Unterstützter AWS Service: Amazon EC2

  • Betriebssystem: Ubuntu 22.04

  • Rechenarchitektur: x86

  • Python:/opt/tensorflow/bin/python3.12

  • TensorFlow Ausführung: 2.18

  • NVIDIA-Treiber:

    • OS Nvidia-Treiber: 570.172.08

  • CUDA12 NVIDIA-Stapel:

    • CUDA-, NCCL- und cuDDN-Installationspfad:/-12.5/ usr/local/cuda

  • EFA-Installationsprogramm: 1.43.1

  • AWS CLI v2 als aws2 und AWS CLI v1 als aws

  • EBS-Volumetyp: gp3

  • Fragen Sie die AMI-ID mit dem SSM-Parameter ab (Beispiel Region ist us-east-1):

    • OSS Nvidia-Treiber:

      aws ssm get-parameter --region us-east-1 \ --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.18-ubuntu-22.04/latest/ami-id \ --query "Parameter.Value" \ --output text
  • AMI-ID abfragen mit AWSCLI (Beispiel Region ist us-east-1):

    • OSS Nvidia-Treiber:

      aws ec2 describe-images --region us-east-1 \ --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) ????????' 'Name=state,Values=available' \ --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \ --output text

Datum der Veröffentlichung: 2025-02-17

AMI-Name: Deep Learning OSS Nvidia-Treiber AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20250215

Aktualisiert

Entfernt

Datum der Veröffentlichung: 20.01.2025

AMI-Name: Deep Learning OSS Nvidia-Treiber AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20250118

Aktualisiert

Veröffentlichungsdatum: 2024-12-09

AMI-Name: Deep Learning OSS Nvidia-Treiber AMI GPU TensorFlow 2.18 (Ubuntu 22.04) 20241206

Hinzugefügt

  • Erste Version der Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.18 (Ubuntu 22.04) -Serie.

    • Die Software umfasst Folgendes:

      • „nvidia-driver=550.127.05"

      • „Fabric-Manager=550.127.05"

      • „cuda=12,5“

      • „cudnn=9,5.1"

      • „efa=1,37,0“

      • „nccl=2,23,4“

      • „aws-nccl-ofi-plugin=v1.13.0-aws“

  • Die virtuelle Tensorflow-Umgebung (Aktivierungsbefehlsquelle/) umfasst Folgendes: opt/tensorflow/bin/activate

    • „tensorflow = 2.18.0“

Fixed

  • Aufgrund einer Änderung im Ubuntu-Kernel zur Behebung eines Fehlers in der KASLR-Funktionalität (Kernel Address Space Layout Randomization) können G4Dn/G5-Instances CUDA auf dem OSS-Nvidia-Treiber nicht ordnungsgemäß initialisieren. Um dieses Problem zu beheben, enthält dieses DLAMI Funktionen, die den proprietären Treiber für G4Dn- und G5-Instances dynamisch laden. Bitte rechnen Sie mit einer kurzen Initialisierungszeit für diesen Ladevorgang, um sicherzustellen, dass Ihre Instanzen ordnungsgemäß funktionieren.

    • Um den Status und den Zustand dieses Dienstes zu überprüfen, können Sie die folgenden Befehle verwenden:

sudo systemctl is-active dynamic_driver_load.service active