Création de clusters SageMaker HyperPod à l’aide de modèles CloudFormation
Vous pouvez créer des clusters SageMaker HyperPod à l’aide des modèles CloudFormation pour HyperPod. Vous devez installer l’AWS CLI pour continuer.
Dans cette rubrique :
Configuration des ressources dans la console et déploiement à l’aide de CloudFormation
Vous pouvez configurer les ressources à l’aide de la AWS Management Console et les déployer à l’aide des modèles CloudFormation.
Procédez comme suit :
-
Au lieu de choisir Soumettre, choisissez Télécharger les paramètres du modèle CloudFormation à la fin du didacticiel dans Prise en main de SageMaker HyperPod à l’aide de la console SageMaker AI. Le didacticiel contient des informations de configuration importantes dont vous aurez besoin pour créer votre cluster avec succès.
Important
Si vous choisissez Soumettre, vous ne pourrez pas déployer un cluster portant le même nom tant que vous ne l’aurez pas supprimé.
Une fois que vous avez choisi Télécharger les paramètres du modèle CloudFormation, la fenêtre Utilisation du fichier de configuration pour créer le cluster à l’aide de l’AWS CLI apparaît sur le côté droit de la page.
-
Dans la fenêtre Utilisation du fichier de configuration pour créer le cluster à l’aide de l’AWS CLI, choisissez Télécharger le fichier de paramètres de configuration. Ce fichier sera téléchargé sur votre ordinateur. Vous pouvez modifier le fichier JSON de configuration en fonction de vos besoins ou le laisser tel quel, si aucune modification n’est requise.
-
Dans un terminal, accédez à l’emplacement du fichier de paramètres
file://params.json. -
Exécutez la commande AWS CLI create-stack pour déployer la pile CloudFormation qui provisionnera les ressources configurées et créera le cluster HyperPod.
aws cloudformation create-stack --stack-namemy-stack--template-urlhttps://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
Pour visualiser le statut du provisionnement des ressources, accédez à la console CloudFormation
. Une fois la création du cluster terminée, visualisez le nouveau cluster sous Clusters dans le volet principal de la console SageMaker HyperPod. Vous pouvez vérifier son statut dans la colonne Statut.
-
Une fois que le statut du cluster est passé à
InService, vous pouvez commencer à vous connecter aux nœuds du cluster. Pour accéder aux nœuds du cluster et commencer à exécuter des charges de travail ML, consultez Tâches sur les clusters SageMaker HyperPod.
Configuration et déploiement de ressources à l’aide de CloudFormation
Vous pouvez configurer et déployer des ressources à l’aide des modèles CloudFormation pour SageMaker HyperPod.
Procédez comme suit :
-
Téléchargez un modèle CloudFormation pour SageMaker HyperPod depuis le référentiel GitHub sagemaker-hyperpod-cluster-setup
. -
Exécutez la commande AWS CLI create-stack pour déployer la pile CloudFormation qui provisionnera les ressources configurées et créera le cluster HyperPod.
aws cloudformation create-stack --stack-namemy-stack--template-urlURL_of_the_file_that_contains_the_template_body--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
Pour visualiser le statut du provisionnement des ressources, accédez à la console CloudFormation.
Une fois la création du cluster terminée, visualisez le nouveau cluster sous Clusters dans le volet principal de la console SageMaker HyperPod. Vous pouvez vérifier son statut dans la colonne Statut.
-
Une fois que le statut du cluster est passé à
InService, vous pouvez commencer à vous connecter aux nœuds du cluster.