Solución de problemas de actualizaciones del clúster AWS PCS - AWS PCS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas de actualizaciones del clúster AWS PCS

Este tema le ayuda a identificar y resolver los problemas más comunes que se pueden producir al actualizar las configuraciones del clúster.

La actualización falla debido a un error de configuración de la contabilidad

Causa habitual

El clúster entra en UPDATE_FAILED estado y el mensaje de error indica un problema de configuración contable. Esto suele ocurrir cuando la configuración contable no es compatible con la versión actual de Slurm o contiene una configuración no válida.

Resolución

Revise la configuración de contabilidad para comprobar si es compatible con la versión de Slurm del clúster y envíe una solicitud de actualización corregida con los parámetros de configuración válidos.

La actualización falla debido a un error de configuración personalizada

Causa habitual

El clúster entra en UPDATE_FAILED estado y el mensaje de error indica un problema con la configuración personalizada de Slurm. Esto ocurre cuando se proporcionan valores de parámetros de Slurm no válidos o combinaciones de parámetros no compatibles.

Resolución

Valide su configuración personalizada de Slurm con los parámetros admitidos y envíe una solicitud de actualización corregida con valores y combinaciones de parámetros válidos.

No se puede enviar la solicitud de actualización

Causa habitual

El botón de actualización está deshabilitado en la consola o la API devuelve un error de nivel 400. Esto ocurre cuando el clúster no está en un estado adecuado, los recursos asociados no están activos o hay errores de validación en la configuración.

Resolución

Espere a que el clúster y todos los recursos asociados alcancen el ACTIVE estado y, a continuación, revise la configuración para ver si hay errores de validación antes de volver a enviar la solicitud de actualización.

Errores de validación

Causa habitual

El comando vuelve inmediatamente con un error HTTP de nivel 400 y un mensaje descriptivo. Esto se debe a que el estado del clúster, el estado de los recursos o los parámetros de configuración no son válidos.

Resolución

Corrija el error de validación específico mencionado en la respuesta y vuelva a intentar la operación de actualización.