View a markdown version of this page

Utilizzo di PCS-ready DLAMI con AWS PZ - AWS PZ

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di PCS-ready DLAMI con AWS PZ

AWS PCS-ready DLAMI Base GPU AMI (Ubuntu 24.04) è un' AWS-maintained Amazon Machine Image per l' AI/ML esecuzione e i carichi di lavoro HPC su PC. AWS Fornisce una base pronta per la produzione in modo da poter distribuire cluster in pochi minuti anziché creare e convalidare AMI personalizzate.

Cosa è incluso

PCS-ready DLAMI è basato sull'AMI GPU Deep Learning Base (Ubuntu 24.04) e aggiunge i AWS seguenti componenti PCS:

  • PCS Agent: l'agente di gestione del cluster AWS PCS

  • Slurm per AWS PCS — Sono preinstallate più versioni Slurm supportate. La versione corretta viene attivata automaticamente durante l'avvio dell'istanza in base alla configurazione del cluster.

  • Utilità EFS: per il montaggio di file system Amazon EFS

Il codice sorgente DLAMI fornisce il sistema operativo (Ubuntu 24.04), i driver GPU NVIDIA, il toolkit CUDA, i driver EFA, il client Lustre e altre infrastrutture di base. Per i dettagli su questi componenti, consulta le note di rilascio dell'AMI Deep Learning.

PCS-ready DLAMI è disponibile per entrambe le architetture x86_64 e arm64.

Nota

PCS-ready DLAMI non include software applicativi come AI/ML framework (PyTorch,, JAX) TensorFlow, compilatori o librerie matematiche. Puoi aggiungere il tuo livello applicativo su file system condivisi o creando un'AMI personalizzata su PCS-ready DLAMI.

Ogni campo Descrizione dell'AMI ne riassume il contenuto, incluso il DLAMI di origine su cui si basa, la versione PCS Agent, le versioni Slurm supportate e la versione delle utilità EFS. Puoi visualizzare questo campo nella console Amazon EC2 o utilizzando l'describe-imagesAPI. Di seguito è riportato un esempio di valore del campo Descrizione:

PCS-Ready DLAMI based on Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20260522. PCS Agent: 1.4.0-1. Slurm: 24.11.7-1, 25.05.7-1, 25.11.2-1. EFS Utils: 2.4.2

Trova il PCS-ready DLAMI attuale

Console di gestione AWS
Per trovare PCS-ready DLAMI nella console
  1. Apri la console AWS PCS e naviga per creare o modificare un gruppo di nodi di calcolo.

  2. Nella sezione Selezione AMI, seleziona PCS-ready AMI.

  3. Viene visualizzato un menu a discesa che mostra i PCS-ready DLAMI disponibili filtrati in base all'architettura del tipo di istanza selezionata.

  4. Scegli l'AMI di PCS-ready base AWS DLAMI (Ubuntu 24.04). Il menu a discesa mostra l'ID AMI e il nome completo dell'AMI di seguito come riferimento.

AWS CLI

Puoi recuperare l'ID AMI PCS-ready DLAMI più recente utilizzando Amazon EC2 Systems Manager Parameter Store. Sostituisci con il tuoregion-code. Regione AWS

  • x86_64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id \ --query "Parameter.Value" --output text
  • arm64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/arm64/latest/ami-id \ --query "Parameter.Value" --output text

In alternativa, puoi cercare PCS-ready DLAMI per modello di nome:

  • x86_64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-x86_64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text
  • arm64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-arm64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text

Usa l'ID AMI quando crei o aggiorni un gruppo di nodi di calcolo.

Utilizza con Infrastructure as Code

Il percorso del parametro SSM fornisce un riferimento stabile che si risolve sempre all'ID AMI più recente. Puoi utilizzarlo nei CloudFormation modelli per raccogliere automaticamente le nuove versioni durante la ridistribuzione:

AmiId: '{{resolve:ssm:/aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id}}'

Effettua l'aggiornamento a una nuova versione

AWS rilascia versioni PCS-ready DLAMI aggiornate quando l'AMI GPU Deep Learning Base di origine viene aggiornato o quando i componenti PCS (PCS Agent o Slurm for PCS) vengono aggiornati. Per aggiornare il cluster, recupera l'ID AMI più recente utilizzando il parametro SSM o la ricerca per nome descritta sopra, quindi aggiorna ogni gruppo di nodi di calcolo in modo che faccia riferimento al nuovo ID AMI.