Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Preguntas frecuentes sobre las versiones de Slurm en PCS AWS
AWS El PCS mantiene el soporte para varias versiones de Slurm. Cuando se presenta una nueva versión de Slurm, AWS PCS proporciona soporte técnico y parches de seguridad hasta que SchedMD llegue a su fin de soporte (EOS). AWS Para mantener la coherencia con la terminología utilizada en PCS, una versión de Slurm indica el final de su vida útil (EOL) para mantener la coherencia con la terminología. AWS
¿Durante cuánto tiempo es compatible AWS PCS con una versión Slurm?
AWS El soporte de PCS para las versiones de Slurm se alinea con los ciclos de soporte de SchedMD para las versiones principales. AWS PCS admite la versión actual y las 2 versiones principales anteriores más recientes. Cuando SchedMD lanza una nueva versión principal, AWS PCS deja de dar soporte a la versión compatible más antigua. AWS PCS lanza las nuevas versiones principales de Slurm lo antes posible, pero es posible que haya un retraso entre el lanzamiento de SchedMD y su disponibilidad en PCS. AWS
¿Cómo obtienen mis clústeres las nuevas versiones de parches de Slurm?
Para corregir errores y corregir problemas de seguridad, el AWS PCS está diseñado para aplicar automáticamente los parches a los controladores de clúster que se ejecutan en las cuentas internas propiedad del servicio. Para instalar parches en sus EC2 instancias Cuenta de AWS, actualice la Amazon Machine Image (AMI) de sus grupos de nodos de cómputo y actualice los grupos de nodos de cómputo para usar la AMI actualizada. Para obtener más información, consulte Imágenes personalizadas de Amazon Machine (AMIs) para AWS PCS.
nota
Los controladores Slurm no estarán disponibles mientras los actualizamos. Los trabajos en ejecución no se ven afectados. Los trabajos enviados antes de que el controlador del clúster dejara de estar disponible se retienen hasta que el controlador esté disponible.
¿Cómo me informan sobre un próximo evento de EOL de la versión de Slurm?
Te enviamos un mensaje de correo electrónico 6 meses antes de la fecha de fin de vida. Le enviamos un mensaje de correo electrónico cada mes antes de la EOL, y un último mensaje de correo electrónico una semana antes de la fecha de EOL. Después de la fecha de fin de vida, enviamos mensajes de correo electrónico mensuales durante 12 meses a los clientes que utilizan clústeres de AWS PCS con versiones de EOL Slurm. Podríamos suspender un clúster con una versión de EOL Slurm si se identifican vulnerabilidades de seguridad en esa versión.
¿Cómo puedo determinar si la versión de Slurm que utiliza mi clúster ejecuta una versión de Slurm de EOL?
Le enviamos un mensaje de correo electrónico para notificarle que tiene un clúster en ejecución con una versión de EOL Slurm. Publicamos una alerta en las AWS Health Dashboard alertas que contiene los detalles de sus clústeres con versiones de EOL Slurm. También puede utilizar la consola AWS PCS para identificar los clústeres con las versiones de EOL Slurm.
¿Qué debo hacer si mi versión de Slurm se acerca o supera el EOL?
Cree un clúster nuevo con una versión compatible más reciente de Slurm y actualice la versión de Slurm en su grupo de nodos de cómputo. AMIs La versión de Slurm en tus EC2 instancias AMIs y en ejecución no puede estar más de 2 versiones por detrás de la versión de Slurm del clúster. Para obtener más información, consulte Imágenes personalizadas de Amazon Machine (AMIs) para AWS PCS.
¿Qué pasará si no cambio a una versión más reciente de Slurm antes de la fecha de fin de vida?
No puedes crear nuevos clústeres con una versión de EOL Slurm. Los clústeres existentes pueden funcionar hasta 12 meses sin AWS soporte y no se requiere ninguna acción inmediata para mantener su funcionamiento. Después de la fecha de fin de vida, no se garantizan el soporte, las actualizaciones de seguridad ni la disponibilidad. Es posible que suspendamos un clúster por motivos de seguridad. Le recomendamos encarecidamente que utilice una versión de Slurm compatible para mantener la seguridad y el soporte de sus clústeres de AWS PCS.
¿Cuáles son los riesgos de operar un clúster con las versiones de EOL Slurm?
Los clústeres con versiones de EOL Slurm presentan importantes riesgos operativos y de seguridad. Sin la supervisión activa de SchedMD, es posible que las vulnerabilidades de seguridad pasen desapercibidas o no se aborden. Si se descubren vulnerabilidades críticas, podríamos suspender sus clústeres de inmediato.
¿Qué ocurre con mis trabajos, la computación del clúster, el almacenamiento y los recursos de red cuando mi clúster está suspendido?
Se cancelan todos los recursos gestionados por AWS PCS. Esto incluye el controlador Slurm, los grupos de nodos de cómputo y EC2 las instancias. Todos los trabajos que se ejecuten en las instancias de procesamiento finalizan inmediatamente y el clúster pasa a un estado suspendido. Los recursos administrados por el cliente, como los sistemas de archivos externos, permanecen intactos. Puede utilizar la consola AWS PCS y las acciones de la API para acceder a la configuración del clúster.
¿Puedo reiniciar un clúster suspendido para reanudar sus tareas restantes?
No, no puedes reiniciar un clúster suspendido. Puedes usar la configuración del clúster suspendido para crear un clúster nuevo con una versión de Slurm compatible. Puede ejecutar los trabajos restantes si los ha guardado en un sistema de archivos externo.
¿Puedo solicitar una prórroga más allá del período de gracia de 12 meses?
No, no puedes solicitar una extensión para ejecutar tu clúster más allá del período de gracia de 12 meses. Proporcionamos la prórroga para ayudarte a cambiar a una versión de Slurm compatible. Para evitar que se interrumpan las operaciones del clúster, le recomendamos que cambie antes de que la versión de Slurm llegue a su fin de vida.