Solución de problemas de la configuración de Slurm personalizada en PCS AWS - AWS PIEZAS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas de la configuración de Slurm personalizada en PCS AWS

Si encuentra errores al crear o actualizar los recursos del AWS PCS con la configuración personalizada de Slurm, puede utilizar el registro para diagnosticar y resolver los problemas.

Solución de problemas de configuración personalizada de Slurm incompatibles

Problema: recibe un mensaje de error similar al siguiente al realizar operaciones de clúster, grupo de nodos de cómputo o cola:

{OPERATION} failed. The Slurm custom settings of the cluster might be incompatible. Check the settings and try again.

Este error puede producirse con las siguientes operaciones:

  • CreateCluster

  • CreateComputeNodeGroup

  • UpdateComputeNodeGroup

  • CreateQueue

  • UpdateQueue

Solución: habilite el registro para comprender el problema específico y solucionar los problemas de configuración incompatibles.

Para solucionar problemas de configuración personalizada de Slurm incompatibles
  1. Cree el clúster si aún no existe, o asegúrese de que el clúster existente esté en un estado en el que se pueda habilitar el registro.

  2. Habilita el registro en tu clúster. Para obtener instrucciones detalladas, consulta Registro y supervisión para AWS PCS.

    nota

    El registro se puede habilitar una vez que se haya creado el clúster.

  3. Revise los registros para identificar el problema específico de configuración de Slurm que está causando la incompatibilidad.

  4. Corrija la configuración personalizada incompatible en función de la información del registro y vuelva a intentar la operación.

Para obtener información sobre los ajustes personalizados de Slurm compatibles, consulte: