Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Résolution des problèmes liés aux paramètres personnalisés de Slurm dans PCS AWS
Si vous rencontrez des erreurs lors de la création ou de la mise à jour des ressources AWS PCS avec les paramètres personnalisés de Slurm, vous pouvez utiliser la journalisation pour diagnostiquer et résoudre les problèmes.
Résolution des problèmes liés aux paramètres personnalisés incompatibles de Slurm
Problème : vous recevez un message d'erreur similaire au suivant lorsque vous effectuez des opérations de cluster, de groupe de nœuds de calcul ou de file d'attente :
{OPERATION} failed. The Slurm custom settings of the cluster might be incompatible. Check the settings and try again.
Cette erreur peut se produire lors des opérations suivantes :
-
CreateCluster
-
CreateComputeNodeGroup
-
UpdateComputeNodeGroup
-
CreateQueue
-
UpdateQueue
Solution : Activez la journalisation pour comprendre le problème spécifique et résoudre les problèmes liés aux paramètres incompatibles.
Pour résoudre les problèmes liés aux paramètres personnalisés incompatibles de Slurm
-
Créez le cluster s'il n'existe pas encore, ou assurez-vous que votre cluster existant est dans un état dans lequel la journalisation peut être activée.
-
Activez la journalisation pour votre cluster. Pour obtenir des instructions complètes, veuillez consulter Journalisation et surveillance pour AWS PCS.
Note
La journalisation peut être activée une fois le cluster créé.
-
Consultez les journaux pour identifier le problème de configuration spécifique de Slurm à l'origine de l'incompatibilité.
-
Corrigez les paramètres personnalisés incompatibles en fonction des informations du journal et recommencez l'opération.
Pour plus d'informations sur les paramètres personnalisés pris en charge par Slurm, voir :