View a markdown version of this page

Utilisation du PCS-ready DLAMI avec AWS PIÈCES - AWS PIÈCES

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation du PCS-ready DLAMI avec AWS PIÈCES

L'AMI GPU de base AWS PCS-ready DLAMI (Ubuntu 24.04) est une image machine AWS-maintained Amazon destinée à l' AI/ML exécution et aux charges de travail HPC sur PC. AWS Il fournit une base prête pour la production qui vous permet de déployer des clusters en quelques minutes au lieu de créer et de valider des AMI personnalisées.

Ce qui est inclus

PCS-ready DLAMI est basé sur l'AMI GPU Deep Learning Base (Ubuntu 24.04) et ajoute les composants PCS suivants : AWS

  • Agent PCS — L'agent de gestion du cluster AWS PCS

  • Slurm pour AWS PC — Plusieurs versions de Slurm prises en charge sont préinstallées. La version correcte est automatiquement activée lors du lancement de l'instance en fonction de la configuration de votre cluster.

  • Utilitaires EFS — Pour le montage des systèmes de fichiers Amazon EFS

Le DLAMI source fournit le système d'exploitation (Ubuntu 24.04), les pilotes GPU NVIDIA, le kit d'outils CUDA, les pilotes EFA, le client Lustre et d'autres infrastructures de base. Pour plus de détails sur ces composants, consultez les notes de mise à jour de l'AMI Deep Learning.

PCS-ready DLAMI est disponible pour les architectures x86_64 et arm64.

Note

PCS-ready DLAMI n'inclut pas les logiciels d'application AI/ML tels que les frameworks PyTorch ( TensorFlow,, JAX), les compilateurs ou les bibliothèques mathématiques. Vous pouvez ajouter votre couche d'application sur des systèmes de fichiers partagés ou en créant une AMI personnalisée au-dessus du PCS-ready DLAMI.

Le champ Description de chaque AMI résume son contenu, y compris le DLAMI source sur lequel elle est basée, la version de l'agent PCS, les versions de Slurm prises en charge et la version des utilitaires EFS. Vous pouvez consulter ce champ dans la console Amazon EC2 ou à l'aide de l'describe-imagesAPI. Voici un exemple de valeur de champ Description :

PCS-Ready DLAMI based on Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20260522. PCS Agent: 1.4.0-1. Slurm: 24.11.7-1, 25.05.7-1, 25.11.2-1. EFS Utils: 2.4.2

Trouvez le PCS-ready DLAMI actuel

AWS Management Console
Pour rechercher le PCS-ready DLAMI dans la console
  1. Ouvrez la console AWS PCS et naviguez pour créer ou modifier un groupe de nœuds de calcul.

  2. Dans la section de sélection des AMI, sélectionnez les PCS-ready AMI.

  3. Une liste déroulante apparaît indiquant les DLAMI disponibles filtrés en fonction PCS-ready du type d'architecture d'instance que vous avez sélectionné.

  4. Choisissez l'AMI de base AWS PCS-ready DLAMI (Ubuntu 24.04). La liste déroulante affiche l'ID de l'AMI et le nom complet de l'AMI ci-dessous à titre de référence.

AWS CLI

Vous pouvez récupérer le dernier ID d'AMI PCS-ready DLAMI à l'aide d'Amazon EC2 Systems Manager Parameter Store. region-codeRemplacez-le par votre Région AWS.

  • x86_64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id \ --query "Parameter.Value" --output text
  • arm64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/arm64/latest/ami-id \ --query "Parameter.Value" --output text

Vous pouvez également rechercher le DLAMI PCS-ready par modèle de nom :

  • x86_64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-x86_64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text
  • arm64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-arm64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text

Utilisez l'ID AMI lorsque vous créez ou mettez à jour un groupe de nœuds de calcul.

Utilisation avec l'infrastructure en tant que code

Le chemin des paramètres SSM fournit une référence stable qui correspond toujours à l'ID d'AMI le plus récent. Vous pouvez l'utiliser dans les CloudFormation modèles pour récupérer automatiquement les nouvelles versions lors du redéploiement :

AmiId: '{{resolve:ssm:/aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id}}'

Mise à jour vers une nouvelle version

AWS publie des versions PCS-ready DLAMI mises à jour lorsque l'AMI GPU source Deep Learning Base est mise à jour ou lorsque les composants PCS (agent PCS ou Slurm pour PCS) sont mis à jour. Pour mettre à jour votre cluster, récupérez le dernier ID d'AMI à l'aide du paramètre SSM ou de la recherche de nom décrit ci-dessus, puis mettez à jour chaque groupe de nœuds de calcul pour faire référence au nouvel ID d'AMI.