Risoluzione dei problemi relativi alle impostazioni Slurm personalizzate nei PCS AWS - AWS PC

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi relativi alle impostazioni Slurm personalizzate nei PCS AWS

Se riscontri errori durante la creazione o l'aggiornamento delle risorse AWS PCS con le impostazioni personalizzate di Slurm, puoi utilizzare la registrazione per diagnosticare e risolvere i problemi.

Risoluzione dei problemi delle impostazioni personalizzate Slurm incompatibili

Problema: durante l'esecuzione di operazioni su cluster, gruppi di nodi di calcolo o code, viene visualizzato un messaggio di errore simile al seguente:

{OPERATION} failed. The Slurm custom settings of the cluster might be incompatible. Check the settings and try again.

Questo errore può verificarsi con le seguenti operazioni:

  • CreateCluster

  • CreateComputeNodeGroup

  • UpdateComputeNodeGroup

  • CreateQueue

  • UpdateQueue

Soluzione: abilitare la registrazione per comprendere il problema specifico e risolvere le impostazioni incompatibili.

Per risolvere i problemi relativi alle impostazioni personalizzate di Slurm incompatibili
  1. Crea il cluster se non esiste ancora o assicurati che il cluster esistente sia in uno stato in cui sia possibile abilitare la registrazione.

  2. Abilita la registrazione per il tuo cluster. Per istruzioni dettagliate, vedi Registrazione e monitoraggio per AWS PCS.

    Nota

    La registrazione può essere abilitata una volta che il cluster è in fase di creazione.

  3. Esamina i log per identificare lo specifico problema di configurazione di Slurm che causa l'incompatibilità.

  4. Correggi le impostazioni personalizzate incompatibili in base alle informazioni di registro e riprova l'operazione.

Per informazioni sulle impostazioni personalizzate Slurm supportate, consulta: