Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Notes de mise à jour pour les versions de Slurm sur PCS AWS
Cette rubrique décrit les modifications importantes apportées à chaque version de Slurm actuellement prise en AWS charge par PCS. Nous vous recommandons de vérifier les modifications entre l'ancienne et la nouvelle version lors de la mise à niveau de votre cluster.
Changements mis en œuvre dans AWS PCS
-
Le Slurm requeue_on_resume_failure est désormais activé par défaut SchedulerParameter .
-
« stderr » a été supprimé en tant qu'option pour LogTimeFormat, car il était désactivé dans Slurm 25.05.
-
AWS PCS prend en charge la configuration sackd multi-clusters : le nœud de connexion peut accéder à plusieurs clusters.
Pour plus d'informations sur Slurm 25.05, consultez les publications suivantes :
Changements mis en œuvre dans AWS PCS
-
AWS PCS prend en charge la comptabilité Slurm. Pour de plus amples informations, veuillez consulter Comptabilité Slurm dans PCS AWS.
Pour plus d'informations sur Slurm 24.11, consultez les publications suivantes :
Changements mis en œuvre dans AWS PCS
-
Le nouveau module Slurm Step Manager est désormais activé par défaut dans AWS PCS. Ce module offre des avantages significatifs en déléguant la gestion des étapes du contrôleur central aux nœuds de calcul, améliorant ainsi considérablement la simultanéité du système dans les environnements où l'utilisation d'étapes est importante. Pour prendre en charge cette configuration et améliorer l'isolation
Prologet l'exécution desEpilogprocessus, de nouveaux indicateurs de prolog (Contain,Alloc) sont activés. -
La communication hiérarchique entre le contrôleur et les nœuds de calcul est activée pour optimiser la communication intra-nœud de Slurm, ce qui améliore l'évolutivité et les performances. De plus, la configuration de routage utilise désormais des listes de nœuds de partition pour les communications provenant du contrôleur, au lieu de l'algorithme de routage par défaut du plugin, ce qui améliore la résilience du système.
-
Un nouveau plugin de hachage
HashPlugin=hash/sha3remplace le précédenthash/k12 plugin. Ceci est désormais activé par défaut dans les clusters AWS PCS. -
Les journaux du contrôleur Slurm incluent désormais des fonctionnalités d'audit améliorées pour tous les appels de procédure à distance (RPC) entrants adressés à.
slurmctldLes journaux incluent l'adresse source, l'utilisateur authentifié et le type RPC avant le traitement de la connexion.
Pour plus d'informations sur Slurm 24.05, consultez les publications suivantes :
Réglages de Slurm que vous pouvez modifier dans PCS AWS
-
La
SuspendTimevaleur par défaut est.60Utilisez le paramètrescaleDownIdleTimeInSecondsde configuration AWS PCS pour le définir. Pour plus d'informations, consultez lescaleDownIdleTimeInSecondsparamètre du type deClusterSlurmConfigurationdonnées dans la référence de l'API AWS PCS. -
Le
MaxJobCountetMaxArraySizeest basé sur la taille que vous avez choisie pour le cluster. Pour plus d'informations, consultez lesizeparamètre de l'action d'CreateClusterAPI dans la référence d'API AWS PCS. -
Le paramètre
SelectTypeParametersSlurm est défini par défaut sur.CR_CPUVous pouvez le fournir sous forme de valeurslurmCustomSettingspour le définir lorsque vous créez un cluster. Pour plus d'informations, consultez leslurmCustomSettingsparamètre de l'action d'CreateClusterAPI et le manuel SlurmCustomSettingde référence de l'API AWS PCS. -
Vous pouvez définir
PrologetEpilogau niveau du cluster. Vous pouvez le fournir sous forme de valeurslurmCustomSettingspour le définir lorsque vous créez un cluster. Pour plus d'informations, voirCreateClusteret SlurmCustomSettingdans le manuel de référence de l'API AWS PCS. -
Vous pouvez définir
WeightetRealMemoryau niveau du groupe de nœuds de calcul. Vous pouvez le fournir sous forme de valeurslurmCustomSettingspour le définir lorsque vous créez un groupe de nœuds de calcul. Pour plus d'informations, voirCreateComputeNodeGroupet SlurmCustomSettingdans le manuel de référence de l'API AWS PCS.