AWS ARM64 Deep-Learning-Base-GPU-AMI (Amazon Linux 2) - AWS Deep Learning AMIs

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

AWS ARM64 Deep-Learning-Base-GPU-AMI (Amazon Linux 2)

Hilfe zu den ersten Schritten finden Sie unterErste Schritte mit DLAMI.

AMI-Namensformat

  • Deep Learning ARM64 Base OSS Nvidia-Treiber-GPU-AMI (Amazon Linux 2) $ {YYYY-MM-DD}

EC2 Unterstützte Instanzen

  • G5g

Das AMI umfasst Folgendes:

  • Unterstützter AWS Service: Amazon EC2

  • Betriebssystem: Amazon Linux 2

  • Rechenarchitektur: ARM64

  • Linux-Kernel: 5.10

  • NVIDIA-Treiber: 550.144.03

  • NVIDIA CUDA 12.1, 12.2, 12.3-Stapel:

    • Installationsverzeichnisse CUDA, NCCL und cuDDN:

      • Beispiel:/usr/local/cuda-12.1/ , /usr/local/cuda-12.1/

    • Kompilierte NCCL-Version:

      • Für das CUDA-Verzeichnis von 12.3, kompilierte NCCL-Version 2.21.5+. CUDA12

      • Für das CUDA-Verzeichnis 12.1, 12.2, kompilierte NCCL-Version 1.8.5+ 2. CUDA12

    • Standard-CUDA: 12.1

      • PATH//usr/local/cudazeigt auf CUDA 12.1

      • Die folgenden Umgebungsvariablen wurden aktualisiert:

        • LD_LIBRARY_PATH soll/64 haben usr/local/cuda-12.1/lib:/usr/local/cuda-12.1/lib64:/usr/local/cuda-12.1:/usr/local/cuda-12.1/targets/sbsa-linux/lib:/usr/local/cuda-12.1/nvvm/lib64:/usr/local/cuda-12.1/extras/CUPTI/lib

        • PATH soll//haben usr/local/cuda-12.1/bin/:/usr/local/cuda-12.1/include

        • Für jede andere CUDA-Version aktualisieren Sie LD_LIBRARY_PATH bitte entsprechend.

  • AWS CLI v2 bei//2 und v1 bei/usr/local/bin/aws AWS CLI usr/bin/aws

  • EBS-Volumetyp: gp3

  • Nvidia-Container-Toolkit: 1.16.2

    • Versionsbefehl: -V nvidia-container-cli

  • Docker: 26.1.2

  • Python:/usr/bin/python3.10

  • Fragen Sie die AMI-ID mit dem SSM-Parameter ab (Beispiel Region ist us-east-1):

    SSM_PARAMETER=base-oss-nvidia-driver-gpu-amazon-linux-2/latest/ami-id \ aws ssm get-parameter --region us-east-1 \ --name /aws/service/deeplearning/ami/arm64/$SSM_PARAMETER \ --query "Parameter.Value" \ --output text
  • AMI-ID abfragen mit AWSCLI (Beispiel Region ist us-east-1):

    aws ec2 describe-images --region us-east-1 \ -owners amazon \ --filters 'Name=name,Values=Deep Learning ARM64 Base OSS Nvidia Driver GPU AMI (Amazon Linux 2) ????????' 'Name=state,Values=available' \ --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \ --output text

Hinweise

NVIDIA-Container-Toolkit 1.17.4

In der Container Toolkit-Version 1.17.4 ist das Mounten von CUDA-kompatiblen Bibliotheken jetzt deaktiviert. Um die Kompatibilität mit mehreren CUDA-Versionen in Container-Workflows sicherzustellen, stellen Sie bitte sicher, dass Sie Ihren LD_LIBRARY_PATH so aktualisieren, dass er Ihre CUDA-Kompatibilitätsbibliotheken enthält, wie im Tutorial Wenn Sie eine CUDA-Kompatibilitätsschicht verwenden gezeigt.

Unterstützungspolitik

Diese AMIs Komponenten dieses AMI, wie CUDA-Versionen, können auf der Grundlage von Framework-Supportrichtlinien oder zur Optimierung der Leistung für Deep-Learning-Container oder zur Reduzierung der AMI-Größe in einer future Version ohne vorherige Ankündigung entfernt und geändert werden. Wir entfernen CUDA-Versionen, AMIs wenn sie nicht von einer unterstützten Framework-Version verwendet werden.

Kernel
  • Die Kernel-Version wird mit dem folgenden Befehl gepinnt:

    sudo yum versionlock kernel*
  • Wir empfehlen Benutzern, die Aktualisierung ihrer Kernel-Version zu vermeiden (es sei denn, es liegt ein Sicherheitspatch vor), um die Kompatibilität mit den installierten Treibern und Paketversionen sicherzustellen. Wenn Benutzer dennoch ein Update durchführen möchten, können sie die folgenden Befehle ausführen, um ihre Kernelversionen zu entsperren:

    sudo yum versionlock delete kernel* sudo yum update -y
  • Für jede neue Version von DLAMI wird der neueste verfügbare kompatible Kernel verwendet.

Veröffentlichungsdatum: 2025-02-17

AMI-Name: Deep Learning ARM64 Base OSS Nvidia-Treiber GPU AMI (Amazon Linux 2) 20250214

Aktualisiert

Entfernt

Datum der Veröffentlichung: 17.01.2025

AMI-Name: Deep Learning ARM64 Base OSS Nvidia-Treiber GPU AMI (Amazon Linux 2) 20250117

Aktualisiert

Datum der Veröffentlichung: 22.10.2024

AMI-Name: Deep Learning ARM64 Base OSS Nvidia-Treiber GPU AMI (Amazon Linux 2) 20241022

Aktualisiert

Veröffentlichungsdatum: 2024-10-08

AMI-Name: Deep Learning ARM64 Base OSS Nvidia-Treiber GPU AMI (Amazon Linux 2) 20241008

Aktualisiert

Veröffentlichungsdatum: 2024-06-06

AMI-Name: Deep Learning ARM64 Base OSS Nvidia-Treiber GPU AMI (Amazon Linux 2) 20240606

Aktualisiert

  • Die Nvidia-Treiberversion wurde von 535.161.08 auf 535.183.01 aktualisiert

Datum der Veröffentlichung: 2024-05-14

AMI-Name: Deep Learning ARM64 Base OSS Nvidia-Treiber GPU AMI (Amazon Linux 2) 20240514

Hinzugefügt

  • Erste Version des Deep Learning ARM64 Base OSS DLAMI für Amazon Linux 2