AMI-Namensformat EC2 Unterstützte Instanzen AMI-Inhalte Hinweise Veröffentlichungsdatum: 2025-07-22 Datum der Veröffentlichung: 2025-05-22 Datum der Veröffentlichung: 2025-05-13

AWS Deep-Learning-Base-GPU-AMI (Ubuntu 24.04)

Hilfe zu den ersten Schritten finden Sie unter. Erste Schritte mit DLAMI

AMI-Namensformat

Deep Learning Base OSS Nvidia-Treiber-GPU-AMI (Ubuntu 24.04) $ {YYYY-MM-DD}

EC2 Unterstützte Instanzen

Weitere Informationen finden Sie unter Wichtige Änderungen an DLAMI.
Deep Learning mit OSS Der Nvidia-Treiber unterstützt G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200.

Das AMI umfasst Folgendes:

Unterstützter AWS Service: Amazon EC2
Betriebssystem: Ubuntu 24.04
Rechenarchitektur: x86
Die neueste verfügbare Version ist für die folgenden Pakete installiert:
- Linux-Kernel: 6. 8
- FSx Glanz
- Docker
- AWS CLI v2 bei/usr/bin/aws
- NVIDIA DCGM
- Nvidia-Container-Toolkit:
  - Versionsbefehl: -V nvidia-container-cli
- NVIDIA-Docker2:
  - Versionsbefehl: nvidia-docker version
NVIDIA-Treiber: 570.172.08
NVIDIA CUDA 12.6- und 12.8-Stapel:
- Installationsverzeichnisse für CUDA, NCCL und cuDDN:/-xx.x/ usr/local/cuda
  - Beispiel:/-12.8/ usr/local/cuda-12.8/ , /usr/local/cuda
- Kompilierte NCCL-Version: 2.25.1
- Standard-CUDA: 12.8
  - PATH//usr/local/cudazeigt auf CUDA 12.8
  - Die folgenden Umgebungsvariablen wurden aktualisiert:
    
    LD_LIBRARY_PATH soll/64 haben usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib
    PATH soll//haben usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include
    Für jede andere CUDA-Version aktualisieren Sie LD_LIBRARY_PATH bitte entsprechend.
EFA-Installationsprogramm: 1.43.1
Nvidia GDRCopy: 2.5.1
AWS Das OFI NCCL-Plugin wird mit dem EFA-Installationsprogramm geliefert
- Die Pfade/opt/amazon/ofi-nccl/lib/x86_64-linux-gnu and /opt/amazon/ofi-nccl/efawerden zu LD_LIBRARY_PATH hinzugefügt.
AWS CLI v2 bei/usr/bin/aws
EBS-Volumetyp: gp3
Python:/usr/bin/python3.12
NVMe Speicherort des Instanzspeichers (bei unterstützten EC2 Instanzen):/opt/dlami/nvme

Fragen Sie die AMI-ID mit dem SSM-Parameter ab (Beispiel Region ist us-east-1):

OSS Nvidia-Treiber:


SSM_PARAMETER=base-oss-nvidia-driver-gpu-ubuntu-24.04/latest/ami-id \
    aws ssm get-parameter --region us-east-1 \
    --name /aws/service/deeplearning/ami/x86_64/$SSM_PARAMETER  \
    --query "Parameter.Value" \
    --output text

AMI-ID abfragen mit AWSCLI (Beispiel Region ist us-east-1):

OSS Nvidia-Treiber:


aws ec2 describe-images --region us-east-1 \
    --owners amazon \
    --filters 'Name=name,Values=Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) ????????' 'Name=state,Values=available' \
    --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' \
    --output text

Hinweise

Unterstützungspolitik

Diese AMIs Komponenten dieses AMI, wie CUDA-Versionen, können auf der Grundlage von Framework-Supportrichtlinien oder zur Optimierung der Leistung für Deep-Learning-Container oder zur Reduzierung der AMI-Größe in einer future Version ohne vorherige Ankündigung entfernt und geändert werden. Wir entfernen CUDA-Versionen, AMIs wenn sie nicht von einer unterstützten Framework-Version verwendet werden.

EC2 Instanz mit mehreren Netzwerkkarten

Viele Instance-Typen, die EFA unterstützen, verfügen auch über mehrere Netzwerkkarten.
DeviceIndex ist für jede Netzwerkkarte eindeutig und muss eine nicht negative Ganzzahl sein, die unter dem Grenzwert von ENIs per NetworkCard liegt. Auf P5 NetworkCard ist die Anzahl von ENIs per 2, was bedeutet, dass die einzig gültigen Werte für 0 oder 1 DeviceIndex sind.
- Erstellen Sie für die primäre Netzwerkschnittstelle (Netzwerkkartenindex 0, Geräteindex 0) eine EFA-Schnittstelle (EFA mit ENA). Sie können eine Nur-EFA-Netzwerkschnittstelle nicht als primäre Netzwerkschnittstelle verwenden.
- Verwenden Sie für jede weitere Netzwerkschnittstelle den nächsten ungenutzten Netzwerkkartenindex, Geräteindex 1, und entweder eine EFA (EFA mit ENA) oder eine reine EFA-Netzwerkschnittstelle, je nach Ihrem Anwendungsfall, z. B. den ENA-Bandbreitenanforderungen oder dem IP-Adressraum. Anwendungsfälle finden Sie beispielsweise unter EFA-Konfiguration für P5-Instances.
- Weitere Informationen finden Sie im EFA-Leitfaden hier.

P6-B200-Instanzen

P6-B200-Instances enthalten 8 Netzwerkschnittstellenkarten und können mit dem folgenden Befehl gestartet werden: AWS CLI


aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=5,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=6,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=7,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"

P5en-Instanzen

P5en enthalten 16 Netzwerkschnittstellenkarten und können mit dem folgenden Befehl gestartet werden: AWS CLI


aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
      ...
      "NetworkCardIndex=15,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"

P5/P5e-Instanzen

P5- und P5e-Instances enthalten 32 Netzwerkschnittstellenkarten und können mit dem folgenden Befehl gestartet werden: AWS CLI


aws ec2 run-instances --region $REGION \
    --instance-type $INSTANCETYPE \
    --image-id $AMI --key-name $KEYNAME \
    --iam-instance-profile "Name=dlami-builder" \
    --tag-specifications "ResourceType=instance,Tags=[{Key=Name,Value=$TAG}]" \
    --network-interfaces "NetworkCardIndex=0,DeviceIndex=0,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
     "NetworkCardIndex=1,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
     "NetworkCardIndex=2,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
     "NetworkCardIndex=3,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
     "NetworkCardIndex=4,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa" \
     ...
     "NetworkCardIndex=31,DeviceIndex=1,Groups=$SG,SubnetId=$SUBNET,InterfaceType=efa"

Kernel

Die Kernel-Version wird mit dem folgenden Befehl gepinnt:


echo linux-aws hold | sudo dpkg —set-selections
echo linux-headers-aws hold | sudo dpkg —set-selections
echo linux-image-aws hold | sudo dpkg —set-selections

Wir empfehlen Benutzern, die Aktualisierung ihrer Kernel-Version zu vermeiden (es sei denn, es liegt ein Sicherheitspatch vor), um die Kompatibilität mit den installierten Treibern und Paketversionen sicherzustellen. Wenn Benutzer dennoch ein Update durchführen möchten, können sie die folgenden Befehle ausführen, um ihre Kernelversionen zu entsperren:
```
echo linux-aws install | sudo dpkg -set-selections
echo linux-headers-aws install | sudo dpkg -set-selections
echo linux-image-aws install | sudo dpkg -set-selections
```
Für jede neue Version von DLAMI wird der neueste verfügbare kompatible Kernel verwendet.

Veröffentlichungsdatum: 2025-07-22

AMI-Name: Deep Learning Base OSS Nvidia-Treiber GPU AMI (Ubuntu 24.04) 20250722

Aktualisiert

Der Nvidia-Treiber wurde von 570.158.01 auf 570.172.08 aktualisiert, um CVE-Probleme zu beheben, die im Nvidia-Sicherheitsbulletin für Juli enthalten sind

Datum der Veröffentlichung: 2025-05-22

AMI-Name: Deep Learning Base OSS Nvidia-Treiber GPU AMI (Ubuntu 24.04) 20250522

Hinzugefügt

Unterstützung für P6-B200-Instanzen wurde hinzugefügt EC2

Aktualisiert

Der EFA Installer wurde von Version 1.40.0 auf 1.41.0 aktualisiert
Die kompilierte NCCL-Version wurde von Version 2.25.1 auf 2.26.5 aktualisiert
Die Nvidia DCGM-Version wurde von 3.3.9 auf 4.4.3 aktualisiert

Datum der Veröffentlichung: 2025-05-13

AMI-Name: Deep Learning Base OSS Nvidia-Treiber GPU AMI (Ubuntu 24.04) 20250513

Hinzugefügt

Erste Veröffentlichung des Deep Learning Base OSS DLAMI für Ubuntu 24.04

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Basis-GPU-AMI (Amazon Linux 2023)

Basis-GPU-AMI (Ubuntu 22.04)