View a markdown version of this page

Verwenden von PCS-ready DLAMI mit AWS STK. - AWS STK.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von PCS-ready DLAMI mit AWS STK.

AWS PCS-ready DLAMI Base GPU AMI (Ubuntu 24.04) ist ein AWS-maintained Amazon Machine Image für die Ausführung AI/ML und HPC-Workloads auf PCs. AWS Es bietet eine produktionsbereite Grundlage, sodass Sie Cluster innerhalb von Minuten bereitstellen können, anstatt benutzerdefinierte AMIs zu erstellen und zu validieren.

Was ist enthalten

PCS-ready DLAMI basiert auf dem Deep Learning Base GPU AMI (Ubuntu 24.04) und fügt die folgenden PCS-Komponenten hinzu: AWS

  • PCS Agent — Der AWS PCS-Clusterverwaltungsagent

  • Slurm for AWS PCS — Mehrere unterstützte Slurm-Versionen sind vorinstalliert. Die richtige Version wird beim Start der Instanz automatisch aktiviert, basierend auf der Konfiguration Ihres Clusters.

  • EFS-Dienstprogramme — Zum Mounten von Amazon EFS-Dateisystemen

Das Quell-DLAMI stellt das Betriebssystem (Ubuntu 24.04), NVIDIA-GPU-Treiber, das CUDA-Toolkit, die EFA-Treiber, den Lustre-Client und andere grundlegende Infrastrukturen bereit. Einzelheiten zu diesen Komponenten finden Sie in den Deep Learning AMI-Versionshinweisen.

PCS-ready DLAMI ist sowohl für x86_64- als auch für arm64-Architekturen verfügbar.

Anmerkung

PCS-ready DLAMI umfasst keine Anwendungssoftware wie AI/ML Frameworks (PyTorch,, JAX) TensorFlow, Compiler oder mathematische Bibliotheken. Sie können Ihre Anwendungsebene auf gemeinsam genutzten Dateisystemen hinzufügen oder indem Sie ein benutzerdefiniertes AMI auf PCS-ready DLAMI aufbauen.

Das Beschreibungsfeld jedes AMI fasst seinen Inhalt zusammen, einschließlich der Quell-DLAMI, auf der es basiert, der PCS-Agent-Version, der unterstützten Slurm-Versionen und der Version der EFS-Dienstprogramme. Sie können dieses Feld in der Amazon EC2 EC2-Konsole oder mithilfe der describe-images API anzeigen. Im Folgenden finden Sie ein Beispiel für einen Wert im Feld Beschreibung:

PCS-Ready DLAMI based on Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20260522. PCS Agent: 1.4.0-1. Slurm: 24.11.7-1, 25.05.7-1, 25.11.2-1. EFS Utils: 2.4.2

Finden Sie das aktuelle PCS-ready DLAMI

AWS-Managementkonsole
Um PCS-ready DLAMI in der Konsole zu finden
  1. Öffnen Sie die AWS PCS-Konsole und navigieren Sie zum Erstellen oder Bearbeiten einer Rechenknotengruppe.

  2. Wählen Sie im Abschnitt AMI-Auswahl die Option PCS-ready AMIs aus.

  3. Es erscheint eine Dropdownliste mit verfügbaren PCS-ready DLAMIs, gefiltert nach der Architektur Ihres ausgewählten Instance-Typs.

  4. Wählen Sie AWS PCS-ready DLAMI Base AMI (Ubuntu 24.04). In der Dropdownliste werden die AMI-ID und der vollständige AMI-Name unten als Referenz angezeigt.

AWS CLI

Sie können die neueste PCS-ready DLAMI-AMI-ID mithilfe des Amazon EC2 Systems Manager Parameter Store abrufen. Ersetzen Sie durch Ihreregion-code. AWS-Region

  • x86_64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id \ --query "Parameter.Value" --output text
  • arm64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/arm64/latest/ami-id \ --query "Parameter.Value" --output text

Alternativ können Sie anhand des Namensmusters nach PCS-ready DLAMI suchen:

  • x86_64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-x86_64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text
  • arm64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-arm64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text

Verwenden Sie die AMI-ID, wenn Sie eine Compute-Knotengruppe erstellen oder aktualisieren.

Zusammen mit Infrastructure as Code verwenden

Der SSM-Parameterpfad bietet eine stabile Referenz, die immer zur neuesten AMI-ID aufgelöst wird. Sie können dies in CloudFormation Vorlagen verwenden, um neue Versionen bei der erneuten Bereitstellung automatisch zu übernehmen:

AmiId: '{{resolve:ssm:/aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id}}'

Auf eine neue Version aktualisieren

AWS veröffentlicht aktualisierte PCS-ready DLAMI-Versionen, wenn das Deep Learning Base GPU AMI der Quelle aktualisiert wird oder wenn PCS-Komponenten (PCS Agent oder Slurm for PCS) aktualisiert werden. Um Ihren Cluster zu aktualisieren, rufen Sie die neueste AMI-ID mithilfe des oben beschriebenen SSM-Parameters oder der Namenssuche ab und aktualisieren Sie dann jede Rechenknotengruppe, sodass sie auf die neue AMI-ID verweist.