View a markdown version of this page

Métricas de Slurm en PCS AWS - AWS PIEZAS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Métricas de Slurm en PCS AWS

AWS PCS es compatible con la función de métricas de Slurm, que expone los datos del clúster en tiempo real a través de puntos finales HTTP compatibles con Prometheus y otros sistemas de monitoreo. Para obtener más información, incluido el impacto en el rendimiento y las consideraciones de seguridad, consulte la Guía de métricas en la documentación de Slurm.

Requisitos previos

Antes de habilitar las métricas de Slurm, asegúrese de tener:

  • Versión de clúster: Slurm, versión 25.11 o superior.

  • Grupo de seguridad: reglas que permiten el tráfico HTTP en el puerto 6817 desde las fuentes deseadas.

Habilite el punto final de métricas

Establezca la siguiente configuración de Slurm personalizada a nivel de clúster:

  • MetricsType— Debe especificar un complemento de métricas compatible, como. metrics/openmetrics

  • CommunicationParameters— Debe incluirenable_http.

    importante

    Al habilitarlo, enable_http se expone un punto final HTTP no autenticado. Cualquier persona con acceso de red al puerto 6817 puede leer las métricas de clústeres, trabajos y nodos. Utilice las reglas de los grupos de seguridad para restringir el acceso únicamente a fuentes confiables.

  • PrivateDataNo debe configurarse.

Para obtener información adicional sobre la configuración personalizada de Slurm, consulte. Configuración de los ajustes personalizados de Slurm en PCS AWS

Utilice el punto final de métricas

Consulte el punto final de las métricas desde un host con acceso de red al controlador:

curl http://controller-ip:6817/metrics

Para obtener información adicional sobre las métricas disponibles y la configuración de extracción, consulte la Guía de métricas en la documentación de Slurm.