Mettre à jour un cluster dans AWS PCS - AWS PCS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Mettre à jour un cluster dans AWS PCS

AWS PCS vous permet de mettre à jour les configurations de cluster après leur création via l' UpdateCluster API ou la console. Vous pouvez modifier les paramètres du cluster sans reconstruire votre infrastructure, ce qui réduit les frais opérationnels et les interruptions.

Avantages des mises à jour du cluster

La mise à jour des clusters AWS PCS vous permet d'adapter l'infrastructure HPC aux nouvelles exigences sans interruption de service. Les modifications de configuration prennent quelques minutes au lieu des heures ou plus nécessaires à la reconstruction des clusters. Cette fonctionnalité est importante pour les environnements de production qui nécessitent des temps d'arrêt minimaux et pour les équipes qui doivent ajuster les paramètres du cluster en fonction de l'évolution des modèles de charge de travail.

Modifications de configuration prises en charge

Vous pouvez modifier trois catégories principales de paramètres :

  • Configuration de la comptabilité : activez ou désactivez la comptabilité gérée et configurez les paramètres de rétention.

  • Comportement réduit : ajustez le scaleDownIdleTime paramètre, qui contrôle la durée pendant laquelle les instances dynamiques restent inactives avant que AWS PCS ne les arrête automatiquement.

  • Paramètres personnalisés de Slurm - Modifiez tous les paramètres Slurm pris en charge qui s'appliquent au niveau du cluster, notamment Prolog, Epilog et. SelectTypeParameters

Limites

Vous ne pouvez pas modifier certaines configurations après la création du cluster. Il s’agit des licences suivantes :

  • Configurations des groupes de sécurité

  • Sélection du sous-réseau VPC

  • Taille du cluster

  • Version Slurm

  • Nom du cluster

Ces paramètres sont fondamentaux pour l'architecture du cluster et nécessitent la création d'un nouveau cluster pour les modifier.

Conditions préalables pour les mises à jour du cluster

Avant de mettre à jour un cluster, assurez-vous que les conditions suivantes sont remplies :

  • Le cluster doit être en ACTIVEUPDATE_FAILED, ou en SUSPENDED état

  • Toutes les ressources associées (files d'attente, groupes de nœuds de calcul) doivent être en état ACTIVE

  • Vous devez disposer des autorisations IAM appropriées pour l'opération UpdateCluster

  • Aucune autre opération de mise à jour ne peut être en cours

Processus de mise à jour et impact sur le travail

Lors d'une opération de mise à jour, les nœuds de calcul continuent d'exécuter les tâches existantes même lorsque le contrôleur de cluster devient temporairement inaccessible. Cependant, le système ne peut pas accepter de nouvelles offres d'emploi ni prendre de décisions de planification pendant cette période.

Vous pouvez surveiller les mises à jour du cluster via la console et les interfaces API. Le cluster passera par les états suivants lors d'une mise à jour :

  • UPDATING- Mise à jour en cours

  • ACTIVE- Mise à jour terminée avec succès

  • UPDATE_FAILED- La mise à jour a rencontré une erreur

Facturation lors des mises à jour

Les frais horaires standard pour votre cluster AWS PCS sont maintenus pendant les opérations de mise à jour. Lorsque vous mettez à jour un cluster pour désactiver la comptabilité, la facturation de la fonctionnalité de comptabilité s'arrête dès que le cluster entre dans l'UPDATINGétat. Lors de l'activation de la comptabilité, la facturation ne commence pas tant que le cluster n'a pas terminé la mise à jour avec succès et n'est pas revenu à l'ACTIVEétat actuel.