Actualización de un clúster en AWS PCS - AWS PIEZAS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Actualización de un clúster en AWS PCS

AWS El PCS permite actualizar las configuraciones de los clústeres tras su creación a través de la UpdateCluster API o la consola. Puede modificar la configuración del clúster sin tener que reconstruir la infraestructura, lo que reduce la sobrecarga operativa y minimiza las interrupciones.

Ventajas de las actualizaciones de clústeres

La actualización de los clústeres de AWS PCS le permite adaptar la infraestructura de HPC a los nuevos requisitos sin interrumpir el servicio. Los cambios de configuración tardan unos minutos en lugar de la hora o más necesaria para reconstruir los clústeres. Esta capacidad es importante para los entornos de producción que requieren un tiempo de inactividad mínimo y para los equipos que necesitan ajustar la configuración del clúster a medida que cambian los patrones de carga de trabajo.

Cambios de configuración compatibles

Puede modificar tres categorías principales de ajustes:

  • Configuración de la contabilidad: active o desactive la contabilidad gestionada y configure los ajustes de retención.

  • Comportamiento de reducción: ajuste el scaleDownIdleTime parámetro, que controla cuánto tiempo permanecen inactivas las instancias dinámicas antes de que AWS PCS las termine automáticamente.

  • Configuración personalizada de Slurm: modifique cualquiera de las configuraciones de Slurm compatibles que se apliquen a nivel de clúster, incluidas Prolog, Epilog y. SelectTypeParameters

Limitaciones

No puede modificar determinadas configuraciones después de la creación del clúster. Entre ellos se incluyen:

  • Configuraciones de grupos de seguridad

  • Selección de subredes de VPC

  • Tamaño del clúster

  • Versión Slurm

  • Cluster name (Nombre del clúster)

Estos ajustes son fundamentales para la arquitectura del clúster y requieren la creación de un clúster nuevo para modificarlos.

Requisitos previos para las actualizaciones del clúster

Antes de actualizar un clúster, asegúrese de que se cumplan las siguientes condiciones:

  • El clúster debe estar en ACTIVEUPDATE_FAILED, o SUSPENDED estado

  • Todos los recursos asociados (colas, grupos de nodos de cómputo) deben estar en estado ACTIVE

  • Debe tener los permisos de IAM adecuados para la operación UpdateCluster

  • No se puede realizar ninguna otra operación de actualización

El impacto en el proceso de actualización y en el trabajo

Durante una operación de actualización, los nodos de cómputo siguen ejecutando las tareas existentes incluso cuando no se puede acceder al controlador de clúster por un momento. Sin embargo, el sistema no puede aceptar nuevas solicitudes de trabajo ni tomar decisiones de programación durante este período.

Puede supervisar las actualizaciones del clúster a través de la consola y de la interfaz API. El clúster pasará por los siguientes estados durante una actualización:

  • UPDATING- Actualización en curso

  • ACTIVE- La actualización se ha completado correctamente

  • UPDATE_FAILED- Se ha detectado un error en la actualización

Facturación durante las actualizaciones

Los cargos por hora estándar para su clúster de AWS PCS continúan durante las operaciones de actualización. Al actualizar un clúster para deshabilitar la contabilidad, la facturación de la función de contabilidad se detiene en cuanto el clúster entra en UPDATING estado. Al habilitar la contabilidad, la facturación no comienza hasta que el clúster completa correctamente la actualización y vuelve al ACTIVE estado.