Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation du PCS-ready DLAMI avec AWS PIÈCES
L'AMI GPU de base AWS PCS-ready DLAMI (Ubuntu 24.04) est une image machine AWS-maintained Amazon destinée à l' AI/ML exécution et aux charges de travail HPC sur PC. AWS Il fournit une base prête pour la production qui vous permet de déployer des clusters en quelques minutes au lieu de créer et de valider des AMI personnalisées.
Ce qui est inclus
PCS-ready DLAMI est basé sur l'AMI GPU Deep Learning Base (Ubuntu 24.04) et ajoute les composants PCS suivants : AWS
Agent PCS — L'agent de gestion du cluster AWS PCS
Slurm pour AWS PC — Plusieurs versions de Slurm prises en charge sont préinstallées. La version correcte est automatiquement activée lors du lancement de l'instance en fonction de la configuration de votre cluster.
Utilitaires EFS — Pour le montage des systèmes de fichiers Amazon EFS
Le DLAMI source fournit le système d'exploitation (Ubuntu 24.04), les pilotes GPU NVIDIA, le kit d'outils CUDA, les pilotes EFA, le client Lustre et d'autres infrastructures de base. Pour plus de détails sur ces composants, consultez les notes de mise à jour de l'AMI Deep Learning.
PCS-ready DLAMI est disponible pour les architectures x86_64 et arm64.
Note
PCS-ready DLAMI n'inclut pas les logiciels d'application AI/ML tels que les frameworks PyTorch ( TensorFlow,, JAX), les compilateurs ou les bibliothèques mathématiques. Vous pouvez ajouter votre couche d'application sur des systèmes de fichiers partagés ou en créant une AMI personnalisée au-dessus du PCS-ready DLAMI.
Le champ Description de chaque AMI résume son contenu, y compris le DLAMI source sur lequel elle est basée, la version de l'agent PCS, les versions de Slurm prises en charge et la version des utilitaires EFS. Vous pouvez consulter ce champ dans la console Amazon EC2 ou à l'aide de l'describe-imagesAPI. Voici un exemple de valeur de champ Description :
PCS-Ready DLAMI based on Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20260522. PCS Agent: 1.4.0-1. Slurm: 24.11.7-1, 25.05.7-1, 25.11.2-1. EFS Utils: 2.4.2
Trouvez le PCS-ready DLAMI actuel
Utilisation avec l'infrastructure en tant que code
Le chemin des paramètres SSM fournit une référence stable qui correspond toujours à l'ID d'AMI le plus récent. Vous pouvez l'utiliser dans les CloudFormation modèles pour récupérer automatiquement les nouvelles versions lors du redéploiement :
AmiId: '{{resolve:ssm:/aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id}}'
Mise à jour vers une nouvelle version
AWS publie des versions PCS-ready DLAMI mises à jour lorsque l'AMI GPU source Deep Learning Base est mise à jour ou lorsque les composants PCS (agent PCS ou Slurm pour PCS) sont mis à jour. Pour mettre à jour votre cluster, récupérez le dernier ID d'AMI à l'aide du paramètre SSM ou de la recherche de nom décrit ci-dessus, puis mettez à jour chaque groupe de nœuds de calcul pour faire référence au nouvel ID d'AMI.