

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Versions Slurm en PCS AWS
<a name="slurm-versions"></a>

SchedMD améliore continuellement Slurm avec de nouvelles fonctionnalités, optimisations et correctifs de sécurité. SchedMD publie une nouvelle version majeure à [intervalles réguliers](https://slurm.schedmd.com/upgrades.html#release_cycle) et prévoit de prendre en charge jusqu'à 3 versions à la fois. AWS Le PCS est conçu pour mettre à jour automatiquement le contrôleur Slurm avec des versions de patch. 

Lorsque SchedMD met fin au [support](https://slurm.schedmd.com/upgrades.html#compatibility_window) d'une version majeure particulière, AWS PCS désigne cette version comme étant en fin de vie (EOL). Après EOL, aucun nouveau cluster ne peut être créé avec cette version, bien que les clusters existants puissent continuer à fonctionner jusqu'à 12 mois sans garantie de support. AWS PCS envoie un préavis si une version majeure de Slurm est proche de la fin de vie, afin d'aider les clients à savoir quand mettre à niveau leurs clusters vers une version plus récente prise en charge.

Nous vous recommandons d'utiliser la dernière version prise en charge de Slurm pour déployer votre cluster, afin d'accéder aux avancées et améliorations les plus récentes. 

## Versions de Slurm prises en charge sur PCS AWS
<a name="slurm-versions_releases"></a>

Le tableau suivant indique les versions de Slurm prises en charge ainsi que les dates et informations importantes pour chaque version.


| Version Slurm | Date de sortie de SchedMD | AWS Date de sortie du PCS | AWS Date EOL du PCS | Version minimale de l'agent AWS PCS compatible | Exemple de AWS PCS pris en charge AMIs | 
| --- | --- | --- | --- | --- | --- | 
| 25,05 | 29/05/2025 | 16/10/2025 | 31/05/2027 | 1.0.0-1 |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/pcs/latest/userguide/slurm-versions.html)  | 
| 24,11 | 29/11/2024 | 14/05/2025 | 31/05/2026 | 1.0.0-1 |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/pcs/latest/userguide/slurm-versions.html)  | 

## Versions de Slurm non prises en charge sur PCS AWS
<a name="slurm-versions_unsupported"></a>

Le tableau suivant indique les versions de Slurm qui ne sont pas prises en AWS charge par PCS.


| Version Slurm | Date de sortie de SchedMD | AWS Date de sortie du PCS | AWS Date EOL du PCS | 
| --- | --- | --- | --- | 
| 24,05 | 30/05/2024 | 18/12/2024 | 30/11/2025 | 
| 23,11 | 21/11/2023 | 28/08/2024 | 31/05/2025 | 

# Notes de mise à jour pour les versions de Slurm sur PCS AWS
<a name="slurm-versions_release-notes"></a>

Cette rubrique décrit les modifications importantes apportées à chaque version de Slurm actuellement prise en AWS charge par PCS. Nous vous recommandons de vérifier les modifications entre l'ancienne et la nouvelle version lors de la mise à niveau de votre cluster.

## Slurm 25,05
<a name="slurm-versions_release-notes_25.05"></a>

**Changements mis en œuvre dans AWS PCS**
+ Le Slurm requeue\$1on\$1resume\$1failure est désormais activé par défaut SchedulerParameter .
+ « stderr » a été supprimé en tant qu'option pour LogTimeFormat, car il était désactivé dans Slurm 25.05.
+ AWS PCS prend en charge la configuration sackd multi-clusters : le nœud de connexion peut accéder à plusieurs clusters.

Pour plus d'informations sur Slurm 25.05, consultez les publications suivantes :
+ Annonce de sortie de SchedMD : [https://www.schedmd.com/slurm-version-25-05-0-is-now-available/](https://www.schedmd.com/slurm-version-25-05-0-is-now-available/)
+ [Notes de mise à jour de SchedMD : \$1Notes.md https://github.com/SchedMD/ slurm/blob/slurm-25-05-0-1/RELEASE](https://github.com/SchedMD/slurm/blob/slurm-25-05-0-1/RELEASE_NOTES.md)

## Slurm 24,11
<a name="slurm-versions_release-notes_24.11"></a>

**Changements mis en œuvre dans AWS PCS**
+ AWS PCS prend en charge la comptabilité Slurm. Pour de plus amples informations, veuillez consulter [Comptabilité Slurm dans PCS AWS](slurm-accounting.md).

Pour plus d'informations sur Slurm 24.11, consultez les publications suivantes :
+ [Annonce de sortie de SchedMD](https://www.schedmd.com/slurm-version-24-11-0-is-now-available/)
+ [Notes de mise à jour de SchedMD](https://github.com/SchedMD/slurm/blob/slurm-24-11-0-1/RELEASE_NOTES)

## Slurm 24,05
<a name="slurm-versions_release-notes_24.05"></a>

**Changements mis en œuvre dans AWS PCS**
+ Le nouveau module Slurm Step Manager est désormais activé par défaut dans AWS PCS. Ce module offre des avantages significatifs en déléguant la gestion des étapes du contrôleur central aux nœuds de calcul, améliorant ainsi considérablement la simultanéité du système dans les environnements où l'utilisation d'étapes est importante. Pour prendre en charge cette configuration et améliorer l'isolation `Prolog` et l'exécution des `Epilog` processus, de nouveaux indicateurs de prolog (`Contain`,`Alloc`) sont activés. 
+ La communication hiérarchique entre le contrôleur et les nœuds de calcul est activée pour optimiser la communication intra-nœud de Slurm, ce qui améliore l'évolutivité et les performances. En outre, la configuration de routage utilise désormais des listes de nœuds de partition pour les communications provenant du contrôleur, au lieu de l'algorithme de routage par défaut du plugin, ce qui améliore la résilience du système. 
+ Un nouveau plugin de hachage `HashPlugin=hash/sha3` remplace le précédent`hash/k12 plugin`. Ceci est désormais activé par défaut dans les clusters AWS PCS. 
+ Les journaux du contrôleur Slurm incluent désormais des fonctionnalités d'audit améliorées pour tous les appels de procédure à distance (RPC) entrants adressés à. `slurmctld` Les journaux incluent l'adresse source, l'utilisateur authentifié et le type RPC avant le traitement de la connexion. 

Pour plus d'informations sur Slurm 24.05, consultez les publications suivantes :
+ [Annonce de sortie de SchedMD](https://www.schedmd.com/slurm-version-24-05-0-is-now-available/)
+ [Notes de mise à jour de SchedMD](https://github.com/SchedMD/slurm/blob/slurm-24-05-0-1/RELEASE_NOTES)

## Slurm 23,11
<a name="slurm-versions_release-notes_23.11"></a>

**Réglages de Slurm que vous pouvez modifier dans PCS AWS**
+  La `SuspendTime` valeur par défaut est. `60` Utilisez le paramètre `scaleDownIdleTimeInSeconds` de configuration AWS PCS pour le définir. Pour plus d'informations, consultez le [https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfiguration.html#PCS-Type-ClusterSlurmConfiguration-scaleDownIdleTimeInSeconds](https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfiguration.html#PCS-Type-ClusterSlurmConfiguration-scaleDownIdleTimeInSeconds)paramètre du type de `ClusterSlurmConfiguration` données dans la *référence de l'API AWS PCS*. 
+  Le `MaxJobCount` et `MaxArraySize` est basé sur la taille que vous avez choisie pour le cluster. Pour plus d'informations, consultez le [https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html#PCS-CreateCluster-request-size](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html#PCS-CreateCluster-request-size)paramètre de l'action d'`CreateCluster`API dans la *référence d'API AWS PCS*.
+  Le paramètre `SelectTypeParameters` Slurm est défini par défaut sur. `CR_CPU` Vous pouvez le fournir sous forme de valeur `slurmCustomSettings` pour le définir lorsque vous créez un cluster. Pour plus d'informations, consultez le [https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfigurationRequest.html#PCS-Type-ClusterSlurmConfigurationRequest-slurmCustomSettings](https://docs.aws.amazon.com//pcs/latest/APIReference/API_ClusterSlurmConfigurationRequest.html#PCS-Type-ClusterSlurmConfigurationRequest-slurmCustomSettings)paramètre de l'action d'`CreateCluster`API et le manuel [SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)de *référence de l'API AWS PCS*.
+ Vous pouvez définir `Prolog` et `Epilog` au niveau du cluster. Vous pouvez le fournir sous forme de valeur `slurmCustomSettings` pour le définir lorsque vous créez un cluster. Pour plus d'informations, voir [https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateCluster.html)et [SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)dans le manuel de *référence de l'API AWS PCS*.
+ Vous pouvez définir `Weight` et `RealMemory` au niveau du groupe de nœuds de calcul. Vous pouvez le fournir sous forme de valeur `slurmCustomSettings` pour le définir lorsque vous créez un groupe de nœuds de calcul. Pour plus d'informations, voir [https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateComputeNodeGroup.html](https://docs.aws.amazon.com//pcs/latest/APIReference/API_CreateComputeNodeGroup.html)et [SlurmCustomSetting](https://docs.aws.amazon.com//pcs/latest/APIReference/API_SlurmCustomSetting.html)dans le manuel de *référence de l'API AWS PCS*.

# Questions fréquemment posées sur les versions de Slurm dans PCS AWS
<a name="slurm-versions_faq"></a>

AWS PCS maintient le support pour plusieurs versions de Slurm. Lorsqu'une nouvelle version de Slurm est introduite, AWS PCS fournit un support technique et des correctifs de sécurité jusqu'à ce que cette version atteigne la fin du support (EOS) de SchedMD. AWS Par souci de cohérence avec la terminologie, PCS désigne la date EOS d'une version de Slurm comme étant la date de fin de vie (EOL). AWS 

**Pendant combien de temps AWS PCS supporte-t-il une version de Slurm ?**  
AWS Le support PCS pour les versions de Slurm s'aligne sur les cycles de support de SchedMD pour les versions majeures. AWS PCS prend en charge la version actuelle et les 2 versions majeures précédentes les plus récentes. Lorsque SchedMD publie une nouvelle version majeure, AWS PCS met fin au support de la version supportée la plus ancienne. AWS PCS publie de nouvelles versions majeures de Slurm dès que possible, mais il se peut qu'il y ait un délai entre la sortie de SchedMD et sa disponibilité sur PCS. AWS 

**Comment mes clusters bénéficient-ils des nouvelles versions de correctif de Slurm ?**  
 Pour corriger les bogues et corriger les problèmes de sécurité, le AWS PCS est conçu pour appliquer automatiquement des correctifs aux contrôleurs de cluster qui s'exécutent sur des comptes appartenant au service interne. Pour installer des correctifs sur vos instances EC2 Compte AWS, mettez à jour l'Amazon Machine Image (AMI) pour vos groupes de nœuds de calcul et mettez à jour les groupes de nœuds de calcul afin d'utiliser l'AMI mise à jour. Pour de plus amples informations, veuillez consulter [Images Amazon Machine personnalisées (AMIs) pour AWS PC](working-with_ami_custom.md).

**Note**  
 Les manettes Slurm ne sont pas disponibles pendant leur mise à jour. Les tâches en cours ne sont pas affectées. Les tâches soumises avant que le contrôleur du cluster ne soit indisponible sont conservées jusqu'à ce que le contrôleur soit disponible. 

**Comment suis-je informé d'un prochain événement EOL pour la version Slurm ?**  
 Nous vous envoyons un e-mail 6 mois avant la date de fin de vie. Nous vous envoyons un e-mail chaque mois avant la fin de vie, avec un dernier e-mail une semaine avant la date de fin de vie. Après la date d'expiration, nous envoyons des e-mails mensuels pendant 12 mois aux clients utilisant des clusters AWS PCS avec des versions EOL Slurm. Nous pouvons suspendre un cluster doté d'une version EOL Slurm si des failles de sécurité sont identifiées pour cette version.

**Comment puis-je déterminer si la version de Slurm utilisée par mon cluster exécute une version EOL Slurm ?**  
Nous vous envoyons un e-mail pour vous informer que vous avez un cluster en cours d'exécution avec une version EOL Slurm. Nous publions une Tableau de bord AWS Health alerte contenant les détails de vos clusters avec les versions d'EOL Slurm. Vous pouvez également utiliser la console AWS PCS pour identifier les clusters dotés de versions EOL Slurm. 

**Que dois-je faire si ma version de Slurm est proche ou supérieure à la fin de sa vie ?**  
Créez un nouveau cluster avec une nouvelle version prise en charge de Slurm et mettez à jour la version Slurm dans les AMI de votre groupe de nœuds de calcul. La version de Slurm présente dans vos AMI et les instances EC2 en cours d'exécution ne peuvent pas avoir plus de 2 versions de retard par rapport à la version Slurm du cluster. Pour de plus amples informations, veuillez consulter [Images Amazon Machine personnalisées (AMIs) pour AWS PC](working-with_ami_custom.md). 

**Que se passera-t-il si je ne passe pas à une version plus récente de Slurm avant la date de fin de vie ?**  
Vous ne pouvez pas créer de nouveaux clusters avec une version EOL Slurm. Les clusters existants peuvent fonctionner jusqu'à 12 mois sans AWS assistance, et aucune action immédiate n'est requise pour maintenir leur fonctionnement. Après la date d'expiration, le support, les mises à jour de sécurité et la disponibilité ne sont pas garantis. Nous pouvons suspendre un cluster pour des raisons de sécurité. Nous vous recommandons vivement d'utiliser une version compatible de Slurm pour garantir la sécurité et le support de vos clusters AWS PCS. 

**Quels sont les risques liés à l'exploitation d'un cluster avec les versions EOL Slurm ?**  
Les clusters dotés de versions EOL Slurm présentent des risques opérationnels et de sécurité importants. Sans la surveillance active de SchedMD, les failles de sécurité risquent de ne pas être détectées ou de ne pas être corrigées. Si des vulnérabilités critiques sont découvertes, nous pouvons suspendre immédiatement vos clusters.

**Qu'arrive-t-il à mes tâches, aux ressources de calcul, de stockage et de réseau de mon cluster lorsque mon cluster est suspendu ?**  
 Toutes les ressources gérées par AWS PCS sont supprimées. Cela inclut le contrôleur Slurm, les groupes de nœuds de calcul et les instances EC2. Toutes les tâches exécutées sur des instances de calcul sont immédiatement interrompues et le cluster entre dans un état suspendu. Les ressources gérées par le client, telles que les systèmes de fichiers externes, restent intactes. Vous pouvez utiliser la console AWS PCS et les actions de l'API pour accéder à la configuration du cluster.

**Puis-je redémarrer un cluster suspendu pour reprendre ses tâches restantes ?**  
Non, vous ne pouvez pas redémarrer un cluster suspendu. Vous pouvez utiliser la configuration de votre cluster suspendu pour créer un nouveau cluster avec une version compatible de Slurm. Vous pouvez exécuter les tâches restantes si vous les avez enregistrées dans un système de fichiers externe.

**Puis-je demander une prolongation au-delà de la période de grâce de 12 mois ?**  
Non, vous ne pouvez pas demander de prolongation pour exécuter votre cluster au-delà de la période de grâce de 12 mois. Nous vous fournissons le délai supplémentaire pour vous aider à passer à une version compatible de Slurm. Pour éviter d'interrompre les opérations de votre cluster, nous vous recommandons de changer avant que votre version de Slurm n'atteigne la fin de vie.