Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Questions fréquemment posées sur les versions de Slurm dans PCS AWS
AWS PCS maintient le support pour plusieurs versions de Slurm. Lorsqu'une nouvelle version de Slurm est introduite, AWS PCS fournit un support technique et des correctifs de sécurité jusqu'à ce que cette version atteigne la fin du support (EOS) de SchedMD. AWS Par souci de cohérence avec la terminologie, PCS désigne la date EOS pour une version de Slurm en tant que date de fin de vie (EOL). AWS
Pendant combien de temps AWS PCS supporte-t-il une version de Slurm ?
AWS Le support PCS pour les versions de Slurm s'aligne sur les cycles de support de SchedMD pour les versions majeures. AWS PCS prend en charge la version actuelle et les 2 versions majeures précédentes les plus récentes. Lorsque SchedMD publie une nouvelle version majeure, AWS PCS met fin au support de la version supportée la plus ancienne. AWS PCS publie de nouvelles versions majeures de Slurm dès que possible, mais il se peut qu'il y ait un délai entre la sortie de SchedMD et sa disponibilité sur PCS. AWS
Comment mes clusters bénéficient-ils des nouvelles versions de correctif de Slurm ?
Pour corriger les bogues et corriger les problèmes de sécurité, le AWS PCS est conçu pour appliquer automatiquement des correctifs aux contrôleurs de cluster qui s'exécutent sur des comptes appartenant au service interne. Pour installer des correctifs sur vos EC2 instances Compte AWS, mettez à jour l'Amazon Machine Image (AMI) pour vos groupes de nœuds de calcul et mettez à jour les groupes de nœuds de calcul afin d'utiliser l'AMI mise à jour. Pour de plus amples informations, veuillez consulter Images Amazon Machine personnalisées (AMIs) pour AWS PC.
Note
Les manettes Slurm ne sont pas disponibles pendant leur mise à jour. Les tâches en cours ne sont pas affectées. Les tâches soumises avant que le contrôleur du cluster ne soit indisponible sont conservées jusqu'à ce que le contrôleur soit disponible.
Comment suis-je informé d'un prochain événement EOL pour la version Slurm ?
Nous vous envoyons un e-mail 6 mois avant la date de fin de vie. Nous vous envoyons un e-mail chaque mois avant la fin de vie, avec un dernier e-mail une semaine avant la date de fin de vie. Après la date d'expiration, nous envoyons des e-mails mensuels pendant 12 mois aux clients utilisant des clusters AWS PCS avec des versions EOL Slurm. Nous pouvons suspendre un cluster doté d'une version EOL Slurm si des failles de sécurité sont identifiées pour cette version.
Comment puis-je déterminer si la version de Slurm utilisée par mon cluster exécute une version EOL Slurm ?
Nous vous envoyons un e-mail pour vous informer que vous avez un cluster en cours d'exécution avec une version EOL Slurm. Nous publions une AWS Health Dashboard alerte contenant les détails de vos clusters avec les versions d'EOL Slurm. Vous pouvez également utiliser la console AWS PCS pour identifier les clusters dotés de versions EOL Slurm.
Que dois-je faire si ma version de Slurm est proche ou supérieure à la fin de sa vie ?
Créez un nouveau cluster avec une nouvelle version prise en charge de Slurm et mettez à jour la version de Slurm dans votre groupe de nœuds de calcul. AMIs La version de Slurm présente dans vos EC2 instances AMIs et celles en cours d'exécution ne peut pas avoir plus de 2 versions de retard par rapport à la version Slurm du cluster. Pour de plus amples informations, veuillez consulter Images Amazon Machine personnalisées (AMIs) pour AWS PC.
Que se passera-t-il si je ne passe pas à une version plus récente de Slurm avant la date de fin de vie ?
Vous ne pouvez pas créer de nouveaux clusters avec une version EOL Slurm. Les clusters existants peuvent fonctionner jusqu'à 12 mois sans AWS assistance, et aucune action immédiate n'est requise pour maintenir leur fonctionnement. Après la date d'expiration, le support, les mises à jour de sécurité et la disponibilité ne sont pas garantis. Nous pouvons suspendre un cluster pour des raisons de sécurité. Nous vous recommandons vivement d'utiliser une version compatible de Slurm pour garantir la sécurité et le support de vos clusters AWS PCS.
Quels sont les risques liés à l'exploitation d'un cluster avec les versions EOL Slurm ?
Les clusters dotés de versions EOL Slurm présentent des risques opérationnels et de sécurité importants. Sans la surveillance active de SchedMD, les failles de sécurité risquent de ne pas être détectées ou de ne pas être corrigées. Si des vulnérabilités critiques sont découvertes, nous pouvons suspendre immédiatement vos clusters.
Qu'arrive-t-il à mes tâches, aux ressources de calcul, de stockage et de réseau de mon cluster lorsque mon cluster est suspendu ?
Toutes les ressources gérées par AWS PCS sont supprimées. Cela inclut le contrôleur Slurm, les groupes de nœuds de calcul et EC2 les instances. Toutes les tâches exécutées sur des instances de calcul sont immédiatement interrompues et le cluster entre dans un état suspendu. Les ressources gérées par le client, telles que les systèmes de fichiers externes, restent intactes. Vous pouvez utiliser la console AWS PCS et les actions de l'API pour accéder à la configuration du cluster.
Puis-je redémarrer un cluster suspendu pour reprendre ses tâches restantes ?
Non, vous ne pouvez pas redémarrer un cluster suspendu. Vous pouvez utiliser la configuration de votre cluster suspendu pour créer un nouveau cluster avec une version de Slurm prise en charge. Vous pouvez exécuter les tâches restantes si vous les avez enregistrées dans un système de fichiers externe.
Puis-je demander une prolongation au-delà de la période de grâce de 12 mois ?
Non, vous ne pouvez pas demander de prolongation pour exécuter votre cluster au-delà de la période de grâce de 12 mois. Nous vous fournissons le délai supplémentaire pour vous aider à passer à une version compatible de Slurm. Pour éviter d'interrompre les opérations de votre cluster, nous vous recommandons de changer avant que votre version de Slurm n'atteigne la fin de vie.