Gestion des clusters SageMaker HyperPod Slurm à l’aide de la console SageMaker
Les rubriques suivantes fournissent des conseils sur la façon de gérer SageMaker HyperPod via l’interface utilisateur de console.
Rubriques
Création d’un cluster SageMaker HyperPod
Consultez les instructions dans Prise en main de SageMaker HyperPod à l’aide de la console SageMaker AI pour créer un nouveau cluster SageMaker HyperPod via l’interface utilisateur de la console SageMaker HyperPod.
Navigation dans vos clusters SageMaker HyperPod
Sous Clusters dans le volet principal de la console SageMaker HyperPod, sur la page principale de la console SageMaker HyperPod, tous les clusters créés doivent apparaître dans la section Clusters, qui fournit une vue récapitulative des clusters, de leurs ARN, de leur statut et de leur date de création.
Visualisation des détails de chaque cluster SageMaker HyperPod
Sous Clusters sur la page principale de la console, les noms des clusters sont activés sous forme de liens. Cliquez sur le lien du nom du cluster pour voir les détails de chaque cluster.
Modification d’un cluster SageMaker HyperPod
-
Sous Clusters dans le volet principal de la console SageMaker HyperPod, choisissez le cluster que vous souhaitez mettre à jour.
-
Sélectionnez votre cluster, puis choisissez Modifier.
-
Sur la page Modifier <your-cluster>, vous pouvez modifier les configurations des groupes d’instances existants, ajouter d’autres groupes d’instances, supprimer des groupes d’instances et modifier les balises du cluster. Après avoir apporté des modifications, choisissez Soumettre.
-
Dans la section Configurer les groupes d’instances, vous pouvez ajouter d’autres groupes d’instances en choisissant Créer un groupe d’instances.
-
Dans la section Configurer les groupes d’instances, vous pouvez choisir Modifier pour modifier sa configuration ou Supprimer pour supprimer définitivement le groupe d’instances.
Important
Lorsque vous supprimez un groupe d’instance, tenez compte des points suivants :
-
Votre cluster SageMaker HyperPod doit toujours gérer au moins un groupe d’instances.
-
Assurez-vous que toutes les données critiques sont sauvegardées avant leur suppression.
-
Le processus de suppression ne peut pas être annulé.
Note
La suppression d’un groupe d’instances résilie toutes les ressources de calcul associées à ce groupe.
-
-
Dans la section Balises, vous pouvez mettre à jour les balises du cluster.
-
Suppression d’un cluster SageMaker HyperPod
-
Sous Clusters dans le volet principal de la console SageMaker HyperPod, choisissez le cluster que vous souhaitez supprimer.
-
Sélectionnez votre cluster, puis choisissez Supprimer.
-
Dans la fenêtre contextuelle de suppression du cluster, examinez attentivement les informations du cluster pour confirmer que vous avez choisi le bon cluster à supprimer.
-
Après avoir examiné les informations du cluster, choisissez Oui, supprimer le cluster.
-
Dans le champ textuel pour confirmer la suppression, saisissez
delete. -
Choisissez Supprimer dans le coin inférieur droit de la fenêtre contextuelle pour terminer l’envoi de la demande de suppression du cluster.