Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden von PCS-ready DLAMI mit AWS STK.
AWS PCS-ready DLAMI Base GPU AMI (Ubuntu 24.04) ist ein AWS-maintained Amazon Machine Image für die Ausführung AI/ML und HPC-Workloads auf PCs. AWS Es bietet eine produktionsbereite Grundlage, sodass Sie Cluster innerhalb von Minuten bereitstellen können, anstatt benutzerdefinierte AMIs zu erstellen und zu validieren.
Was ist enthalten
PCS-ready DLAMI basiert auf dem Deep Learning Base GPU AMI (Ubuntu 24.04) und fügt die folgenden PCS-Komponenten hinzu: AWS
PCS Agent — Der AWS PCS-Clusterverwaltungsagent
Slurm for AWS PCS — Mehrere unterstützte Slurm-Versionen sind vorinstalliert. Die richtige Version wird beim Start der Instanz automatisch aktiviert, basierend auf der Konfiguration Ihres Clusters.
EFS-Dienstprogramme — Zum Mounten von Amazon EFS-Dateisystemen
Das Quell-DLAMI stellt das Betriebssystem (Ubuntu 24.04), NVIDIA-GPU-Treiber, das CUDA-Toolkit, die EFA-Treiber, den Lustre-Client und andere grundlegende Infrastrukturen bereit. Einzelheiten zu diesen Komponenten finden Sie in den Deep Learning AMI-Versionshinweisen.
PCS-ready DLAMI ist sowohl für x86_64- als auch für arm64-Architekturen verfügbar.
Anmerkung
PCS-ready DLAMI umfasst keine Anwendungssoftware wie AI/ML Frameworks (PyTorch,, JAX) TensorFlow, Compiler oder mathematische Bibliotheken. Sie können Ihre Anwendungsebene auf gemeinsam genutzten Dateisystemen hinzufügen oder indem Sie ein benutzerdefiniertes AMI auf PCS-ready DLAMI aufbauen.
Das Beschreibungsfeld jedes AMI fasst seinen Inhalt zusammen, einschließlich der Quell-DLAMI, auf der es basiert, der PCS-Agent-Version, der unterstützten Slurm-Versionen und der Version der EFS-Dienstprogramme. Sie können dieses Feld in der Amazon EC2 EC2-Konsole oder mithilfe der describe-images API anzeigen. Im Folgenden finden Sie ein Beispiel für einen Wert im Feld Beschreibung:
PCS-Ready DLAMI based on Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20260522. PCS Agent: 1.4.0-1. Slurm: 24.11.7-1, 25.05.7-1, 25.11.2-1. EFS Utils: 2.4.2
Finden Sie das aktuelle PCS-ready DLAMI
Zusammen mit Infrastructure as Code verwenden
Der SSM-Parameterpfad bietet eine stabile Referenz, die immer zur neuesten AMI-ID aufgelöst wird. Sie können dies in CloudFormation Vorlagen verwenden, um neue Versionen bei der erneuten Bereitstellung automatisch zu übernehmen:
AmiId: '{{resolve:ssm:/aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id}}'
Auf eine neue Version aktualisieren
AWS veröffentlicht aktualisierte PCS-ready DLAMI-Versionen, wenn das Deep Learning Base GPU AMI der Quelle aktualisiert wird oder wenn PCS-Komponenten (PCS Agent oder Slurm for PCS) aktualisiert werden. Um Ihren Cluster zu aktualisieren, rufen Sie die neueste AMI-ID mithilfe des oben beschriebenen SSM-Parameters oder der Namenssuche ab und aktualisieren Sie dann jede Rechenknotengruppe, sodass sie auf die neue AMI-ID verweist.