Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Wichtige NVIDIA-Treiberänderungen für DLAMIs
Am 15. November 2023 AWS wurden wichtige Änderungen an AWS Deep Learning AMIs (DLAMI) im Zusammenhang mit dem verwendeten NIVIDA-Treiber vorgenommen. DLAMIs Informationen darüber, was sich geändert hat und ob sich dies auf Ihre Verwendung von auswirkt, finden Sie unter. DLAMIs Änderung des DLAMI NVIDIA-Treibers FAQs
Änderung des DLAMI NVIDIA-Treibers FAQs
Was hat sich geändert?
Wir haben uns DLAMIs in zwei separate Gruppen aufgeteilt:
-
DLAMIs die einen proprietären NVIDIA-Treiber verwenden (zur Unterstützung von P3, P3dn, G3)
-
DLAMIs die den NVIDIA OSS-Treiber verwenden (zur Unterstützung von G4dn, G5, P4, P5)
Aus diesem Grund haben wir DLAMIs für jede der beiden Kategorien neue mit neuen Namen und neuem AMI erstellt IDs. Diese DLAMIs sind nicht austauschbar. Das heißt, DLAMIs von einer Gruppe werden keine Instances unterstützt, die von der anderen Gruppe unterstützt werden. Beispielsweise unterstützt das DLAMI, das P5 unterstützt, G3 nicht, und das DLAMI, das G3 unterstützt, unterstützt P5 nicht.

Warum war diese Änderung erforderlich?
Bisher war DLAMIs für NVIDIA ein proprietärer Kernel-Treiber von NVIDIA GPUs enthalten. Die Upstream-Linux-Kernel-Community akzeptierte jedoch eine Änderung, die proprietäre Kerneltreiber wie den NVIDIA-GPU-Treiber von der Kommunikation mit anderen Kerneltreibern isoliert. Durch diese Änderung wird GPUDirect RDMA auf Instances der Serien P4 und P5 deaktiviert. Dies ist der Mechanismus, der die effiziente Nutzung von EFA für GPUs verteilte Schulungen ermöglicht. Verwenden Sie daher DLAMIs jetzt den OpenRM-Treiber (NVIDIA-Open-Source-Treiber), der mit den Open-Source-EFA-Treibern verknüpft ist, um G4dn, G5, P4 und P5 zu unterstützen. Dieser OpenRM-Treiber unterstützt jedoch keine älteren Instanzen (wie P3 und G3). Um sicherzustellen, dass wir weiterhin aktuelle, performante und sichere Produkte anbieten, DLAMIs die beide Instanztypen unterstützen, haben wir uns DLAMIs in zwei Gruppen aufgeteilt: eine mit dem OpenRM-Treiber (der G4dn, G5, P4 und P5 unterstützt) und eine mit dem älteren proprietären Treiber (der P3, P3dn und G3 unterstützt).
DLAMIs Worauf hat sich diese Änderung ausgewirkt?
Diese Änderung betraf alle DLAMIs.
Was bedeutet das für dich?
Alle bieten DLAMIs weiterhin Funktionalität, Leistung und Sicherheit, solange Sie sie auf einem unterstützten Amazon Elastic Compute Cloud (Amazon EC2) Instance-Typ ausführen. Um zu ermitteln, welche EC2 Instance-Typen ein DLAMI unterstützt, lesen Sie die Versionshinweise für dieses DLAMI und suchen Sie dann nach Supported Instances. EC2 Eine Liste der derzeit unterstützten DLAMI-Optionen und Links zu ihren Versionshinweisen finden Sie unter. AMIs Versionshinweise zu Deep Learning
Darüber hinaus müssen Sie die richtigen Befehle AWS Command Line Interface (AWS CLI) verwenden, um die aktuelle Version aufzurufen. DLAMIs
Verwenden Sie für Base DLAMIs , die P3, P3dn und G3 unterstützen, diesen Befehl:
aws ec2 describe-images --region us-east-1 --owners amazon \ --filters 'Name=name,Values=Deep Learning Base Proprietary Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' \ --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
Verwenden Sie für Basen DLAMIs , die G4dn, G5, P4 und P5 unterstützen, diesen Befehl:
aws ec2 describe-images --region us-east-1 --owners amazon \ --filters 'Name=name,Values=Deep Learning Base OSS Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' \ --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
Gibt es bei der neueren Version einen Verlust an Funktionalität? DLAMIs
Nein, es gibt keinen Funktionsverlust. Die aktuellen DLAMIs Versionen bieten die gesamte Funktionalität, Leistung und Sicherheit der Vorgängerversionen DLAMIs, sofern Sie sie auf einem unterstützten EC2 Instance-Typ ausführen.
Hatte diese Änderung Auswirkungen auf Deep Learning Containers?
Nein, diese Änderung hatte keine Auswirkungen auf AWS Deep Learning Containers, da sie den NVIDIA-Treiber nicht enthalten. Stellen Sie jedoch sicher, dass Sie Deep Learning Containers auf Geräten ausführen AMIs , die mit den zugrunde liegenden Instances kompatibel sind.