Notas de la versión e historial de revisión - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Notas de la versión e historial de revisión

En las tablas siguientes se describen las principales actualizaciones y nuevas funciones de la Guía del usuario.AWS ParallelCluster Actualizamos la documentación con frecuencia para dar respuesta a los comentarios que se nos envía.

AWS ParallelCluster
Cambio Descripción Fecha

AWS ParallelCluster Publicada la versión 3.13.2

Para actualizar, introduzca lo siguiente:. sudo pip install --upgrade aws-parallelcluster

Correcciones de errores:

  • Corrija un error que podía provocar update-cluster o update-compute-fleet fallar cuando los recursos informáticos hacían referencia a una reserva de capacidad caducada a la que ya no se podía acceder a través de EC2 APIs.

  • Se ha corregido un build-image error en Rocky 9 que se producía cuando la imagen principal no incluía la última versión del núcleo. Consulte https://github.com/aws/aws-parallelcluster/issues/6874.

24 de junio de 2025

AWS ParallelCluster Publicada la versión 3.13.1

Para actualizar, introduzca lo siguiente:. sudo pip install --upgrade aws-parallelcluster

Cambios:

  • Actualice Slurm a la versión 24.05.8.

  • Actualice el instalador de EFA a la 1.41.0 (desde la 1.38.1).

    • Controlador EFA: efa-2.15.0-1

    • Configuración EFA: efa-config-1.18-1

    • Perfil EFA: efa-profile-1.7-1

    • libfabric-aws: libfabric-aws-2.1.0-1

    • Núcleo RDMA: rdma-core-57.0-1

    • MPI abierto: openmpi40-aws-4.1.7-2 y openmpi50-aws-5.0.6

  • Actualice amazon-efs-utils a la versión 2.3.1 (desde la v2.1.0) para las AMI que no sean de Amazon Linux.

  • Support DCV en us-isob-east -1 y us-iso-east -1.

  • Support FSX para Lustre y Ontap en us-isob-east -1 y -1. us-iso-east

  • Garantice la coherencia del núcleo a lo largo ParallelCluster de la creación de la imagen fijándola al principio y quitándola al finalizar.

Correcciones de errores:

  • Se corrigió un error en la instalación de la biblioteca de rendimiento de ARM que provocaba que la imagen de compilación fallara en entornos aislados.

  • Se corrigió un error que impedía que el script 'update_directory_service_password.sh' actualizara la contraseña de AD.

4 de junio de 2025

AWS ParallelCluster Publicada la versión 3.13.0

Para actualizar, introduzca lo siguiente:. sudo pip install --upgrade aws-parallelcluster

Depreciaciones:

  • Esta es la última ParallelCluster versión compatible con Ubuntu 20.04, ya que Ubuntu 20.04 estará disponible en End-Of-Standard-Support mayo de 2025.

Mejoras:

  • Añade soporte para Ubuntu 24.04.

  • Añade soporte para la región ap-southeast-7.

  • Desactiva los servicios no utilizados Cups y wpa_supplicant de Official para mejorar la seguridad. ParallelCluster AMIs

Cambios:

  • Actualice Slurm a la versión 24.05.7.

  • Actualice el controlador NVIDIA a la versión 570.86.15 (desde la 550.127.08) para todos excepto. OSs AL2

  • Actualice el kit de herramientas CUDA a la versión 12.8.0 (desde la 12.4.1) para todos los casos, excepto. OSs AL2

  • Actualice Python a 3.12.8 para todos OSs excepto AL2 (a partir de la 3.9.20).

  • En Ubuntu 22.04, instale el controlador de Nvidia con la misma versión del compilador utilizada para compilar el núcleo.

  • Actualice aws-cfn-bootstrap a la versión 2.0-33.

  • Actualice el instalador de EFA a la 1.38.0 (desde la 1.36.0).

    • Controlador EFA: efa-2.13.0-1

    • Configuración EFA: efa-config-1.17-1

    • Perfil EFA: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Núcleo RDMA: rdma-core-54.0-1

    • Open MPI: openmpi40-aws-4.1.7-1 y openmpi50-aws-5.0.5

  • Actualice a amazon-efs-utils la versión 2.1.0.

  • Elimine los libros de cocina de terceros: apt-7.5.22 y pyenv-4.2.3.

  • Actualiza las dependencias de libros de recetas de terceros:

    • línea4.5.21 (de la línea4.5.13)

    • nfs-5.1.5 (desde nfs-5.1.2)

    • openssh-2.11.14 (desde openssh-2.11.12)

    • yum-7.4.20 (desde yum-7.4.13)

    • yum-epel-5.0.8 (de yum-epel-5.0.2)

  • Actualice Pmix a 5.0.6 (desde 5.0.3).

  • Actualice ARM PL a la versión 24.10 (desde la 23.10).

  • Actualice Python a la versión 3.12.8 (desde la 3.9.17) en la capa Lambda y el instalador.

  • Actualice Nodejs a la versión 20.18.3 (desde la 18.20.3) en la capa Lambda y el instalador.

  • Elimine la generación de claves DSA para los nodos de inicio de sesión como DSA, que dejó de ser compatible con OpenSSH 9.7+.

  • Configura la información sobre el ID y el tipo de instancia en Slurm al lanzar los nodos de cómputo.

  • Instale los controladores de NVIDIA sin la opción 'no-cc-version-check', que ahora está obsoleta en el instalador de NVIDIA.

  • Añada un validador para aplicar hasta 10 grupos de nodos de inicio de sesión.

  • Actualice el tamaño predeterminado del volumen raíz a 45 GB.

Correcciones de errores:

  • Elimine el uso de cfn-init para el arranque de los nodos de cómputo a fin de reducir el tiempo de ampliación de los nodos.

  • Se ha corregido un problema que provocaba un error en el arranque del nodo de cómputo cuando se utilizaba un proxy.

  • En Ubuntu 22.04, instale el controlador de Nvidia con la misma versión del compilador utilizada para compilar el núcleo para evitar errores de instalación.- Corrija la ejecución del aws-parallelcluster-node paquete principal solo en el nodo principal durante la actualización.

  • Se solucionó un problema que provocaba que los trabajos en contenedores ejecutados Pyxis/Enroot en un entorno multiusuario (integrado con Active Directory) fallaran.

  • Se corrigió el uso de authselect que provocaba errores en el arranque de los nodos en Rocky 9.5+ cuando se utilizaba el servicio de directorio.

1 de abril de 2025

AWS ParallelCluster Publicada la versión 3.12.0

Para actualizar, introduzca lo siguiente:. sudo pip install --upgrade aws-parallelcluster

Mejoras:

  • Agregue una nueva sección de configuración de imágenes de compilación Build/Installation para activar/desactivar las instalaciones del software NVIDIA y el cliente Lustre. De forma predeterminada, el software de NVIDIA, aunque está incluido en la versión oficial ParallelCluster AMIs, no lo instala. build-image De forma predeterminada, el cliente Lustre está instalado.

  • La CLI ordena export-cluster-logs y ahora export-image-logs puede exportar los registros de forma predeterminada al ParallelCluster bucket predeterminado o al Customs3Bucket si se especifica en la configuración.

  • Amplíe el soporte de Amazon DCV a Ubuntu 2204 en instancias ARM.

Cambios:

  • Actualice el controlador NVIDIA a la versión 550.127.08 (desde la 550.90.07). Esto soluciona un problema conocido de NVIDIA. Para obtener más información, consulte Problemas conocidos en la documentación del centro de datos de NVIDIA.

  • Actualice Amazon DCV a la versión2024.0-18131.

    • server: 2024.0-18131-1

    • xdcv: 2024.0.631-1

    • gl: 2024.0.1078-1

    • web_viewer: 2024.0-18131-1

  • Actualiza el instalador de EFA a 1.36.0.

    • Efa-driver: efa-2.13.0-1

    • Efa-config: efa-config-1.17-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Rdma-core: rdma-core-54.0-1

    • Open MPI: openmpi40-aws-4.1.7-1 y openmpi50-aws-5.0.5

  • Reinicie automáticamente slurmctld en caso de error.

  • Actualice a la versión 8.0.39. mysql-community-client

  • Elimine la compatibilidad con Python 3.7 y 3.8, que están al final de su vida útil.

Correcciones de errores:

  • Se ha corregido un problema por el que no se detectaban cambios en la secuencia de los scripts de acciones personalizadas durante las actualizaciones de los clústeres.

  • Agregue los permisos faltantes para la AWS ParallelCluster API a fin de crear las funciones vinculadas al servicio para Elastic Load Balancing y Auto Scaling, que se requieren para implementar los nodos de inicio de sesión.

  • Solucione un problema en la forma en que obtenemos la región al administrar los volúmenes para que pueda gestionar correctamente la zona local.

  • Se solucionó un problema por el que se producía un error al agregar sistemas de archivos EFS AccessPointIds durante una actualización.

  • Se solucionó un problema por el que, al utilizar la PCAPI, la actualización del clúster podía fallar al actualizar un parámetro que no era un tipo String (por ejemplo,). MaxCount

  • Al montar un OpenZFS externo, ya no es necesario establecer las reglas de salida para los puertos 111, 2049, 20001, 20002 y 20003.

19 de diciembre de 2024

AWS ParallelCluster Publicada la versión 3.1.1

Características:

  • Ahora, Pyxis está deshabilitado por defecto, por lo que debe habilitarse manualmente, tal y como se indica en la documentación del producto.

  • Actualice el motor de ejecución de Python a la versión 3.12 en ParallelCluster Lambda Layer.

  • Elimina la asignación de versión de setuptools a la versión anterior a la 70.0.0.

  • Actualiza libjwt a la versión 1.17.0.

  • Registro de cambios completo

Correcciones de errores

  • Solucione un problema en la forma en que configuramos el complemento Pyxis Slurm, ParallelCluster que podía provocar errores en el envío de los trabajos.

  • Para solucionar un problema que provocaba un error en la implementación en las configuraciones con nodos de inicio de sesión, añada los permisos faltantes requeridos por los nodos de inicio de sesión en la plantilla pública de políticas. https://github.com/aws/aws-parallelcluster/issues/6483

21 de octubre de 2024

AWS ParallelCluster publicada la versión 3.11.0

Mejoras

  • Añada compatibilidad con acciones personalizadas en los nodos de inicio de sesión.

  • Permita la conexión DCV a los nodos de inicio de sesión.

  • Agregue soporte para la región ap-southeast-3.

  • Agregue grupos de seguridad al balanceador de carga de red del nodo de inicio de sesión.

  • Agregue la AllowedIps configuración de los nodos de inicio de sesión.

  • Agregue una nueva configuración SharedStorage/EfsSettings/AccessPointId para especificar un punto de acceso EFS opcional para un montaje

  • Permita hasta 10 grupos de nodos de inicio de sesión.

  • Instale enroot y pyxis en el pcluster oficial AMIs

Cambios

  • [ÚLTIMA HORA] El loginNodes campo devuelto por la API DescribeCluster y el comando CLI se describe-cluster ha cambiado de un diccionario a una matriz para admitir varios grupos de nodos de inicio de sesión. Este cambio rompe la compatibilidad con versiones anteriores y hace que estas operaciones sean incompatibles con los clústeres implementados con versiones anteriores.

  • Actualice Slurm a la 23.11.10 (desde la 23.11.7).

  • Actualice Pmix a 5.0.3 (desde 5.0.2).

  • Actualiza el instalador de EFA a 1.34.0.

    • Efa-driver: efa-2.10.0-1

    • Efa-config: efa-config-1.17-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • Rdma-core: rdma-core-52.0-1

    • Open MPI: openmpi40-aws-4.1.6-3 y openmpi50-aws-5.0.3-11

  • Actualice el controlador NVIDIA a la versión 550.90.07 (desde la 535.183.01).

  • Actualice el kit de herramientas CUDA a la versión 12.4.1 (desde la 12.2.2).

  • Actualice Python a 3.9.20 (desde 3.9.19).

  • Actualice la biblioteca MPI de Intel a la versión 13.1.769 de la versión 2021.12.1.8.

Correcciones de errores

  • Corrija el validador EfaPlacementGroupValidator para que no sugiera configurar un grupo de ubicación cuando se utilizan bloques de capacidad.

  • Corrija los errores ocasionales de creación de clústeres asegurándose de que, en el caso FSx de Lustre, los sistemas de archivos se creen según las reglas de los grupos de seguridad.

  • Corrige el error de eliminación del clúster cuando el grupo de ubicación está activado.

  • Se ha solucionado el problema que provocaba que los nodos de inicio de sesión se marcaran en mal estado al restringir el acceso SSH

  • Se retrieve_supported_regions corrigió para que pudiera obtener la URL de S3 correcta.

  • Se corrigió describe_images el uso de la paginación.

  • No route tables foundSe corrigió un error al especificar la subred de VPC predeterminada en /Networking/. LoginNodes SubnetIds

26 de septiembre de 2024

AWS ParallelCluster Publicada la versión 3.10.1

Correcciones de errores

  • Corrige un error de creación de imágenes en las regiones de China.

8 de julio de 2024

AWS ParallelCluster Publicada la versión 3.10.0

Mejoras:

  • Agregue una nueva sección de configuración Scheduling/SlurmSettings/ExternalSlurmdbd para conectar el clúster a un Slurmdbd externo.

  • Permita que build-image se ejecute en una red aislada.

  • Añada compatibilidad con Amazon Linux 2023.

  • Agregue soporte para price-capacity-optimized comoAllocationStrategy.

  • Agregue un validador para evitar el uso de grupos de ubicación con bloques de capacidad.

Cambios:

  • Centos 7 ya no es compatible.

  • Actualice Cinc Client a la versión 18.4.12 desde la 18.2.7.

  • Actualice munge a la versión 0.5.16 (desde la 0.5.15).

  • Actualice Pmix a la 5.0.2 (desde la 4.2.9).

  • Actualiza las dependencias de libros de recetas de terceros:

    • apt-7.5.22 (desde apt-7.5.14)

    • openssh-2.11.12 (desde openssh-2.11.3)

  • Elimine el libro de cocina de terceros: selinux-6.1.12.

  • Actualiza el instalador de EFA a 1.32.0.

    • Efa-driver: efa-2.8.0-1

    • Efa-config: efa-config-1.16-1

    • Efa-profile: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.21.0-1

    • Rdma-core: rdma-core-50.0-1

    • Open MPI: openmpi40-aws-4.1.6-3 y openmpi50-aws-5.0.2-12

  • Actualice el controlador NVIDIA a la versión 535.183.01 (desde la 535.154.05).

  • Actualice Python a 3.9.19 (desde 3.9.17).

  • Actualice la biblioteca MPI de Intel a la versión 2021.12.1.8 (desde la versión 2021.9.0.43482).

Correcciones de errores:

  • Corrija la configuración de asociaciones de repositorios de datos para convertirla en opcional. AutoExportPolicy AutoImportPolicy

  • Se ha corregido un problema durante la eliminación del clúster que ahora completa la limpieza de la flota de cómputos cuando las instancias estaban en estado de cierre o finalización. Esto sirve para evitar errores al eliminar los clústeres en el caso de los tipos de instancias con ciclos de terminación más largos.

  • Permite activar el panel de control de Cloudwatch y deshabilitar las alarmas en la Monitoring sección de configuración del clúster.

  • Permita que ParallelCluster Custom Resource suprima el uso de validadores. PclusterCluster/SuppressValidators

  • Eliminarlo /etc/profile.d/pcluster.sh para que no se ejecute en cada inicio de sesión de usuario y no cfn_bootstrap_virtualenv se agregue a la variable de entorno PATH.

  • Corrija ParallelCluster la especificación de la API sustituyendo el campo failureReason por failures en DescribeCluster respuesta.

  • Corrija la especificación de la ParallelCluster API añadiendo el estado de la CloudFormation pila que faltaba:IMPORT_*, yREVIEW_IN_PROGRESS. UPDATE_FAILED

  • Se solucionó un problema que impedía que las actualizaciones del clúster incluyeran sistemas de archivos EFS con cifrado en tránsito.

  • Se ha corregido un problema que impedía que los servicios slurmctld y slurmdbd se reiniciaran al reiniciar el nodo principal cuando se utilizaba EFS para datos internos compartidos.

  • En los sistemas Ubuntu, elimine la configuración predeterminada de logrotate para los archivos de registro de inicio de la nube que no coincidan con la configuración de origen. ParallelCluster

  • Corrija el error de creación de imágenes con RHEL 8.10 o una versión posterior.

27 de junio de 2024

AWS ParallelCluster Publicada la versión 3.9.3

Para realizar la actualización, escriba sudo pip install --upgrade aws-parallelcluster

Características:

  • Añade compatibilidad para FSx Lustre como tipo de almacenamiento compartido en us-iso-east-1.

Correcciones de errores:

  • Elimina cloud_dns de SlurmctldParameters en la configuración de Slurm para evitar problemas de distribución ramificada de Slurm.

    Esta acción no es obligatoria, ya que configuramos las direcciones IP al lanzar la instancia.

19 de junio de 2024

AWS ParallelCluster publicada la versión 3.9.2

Características:

  • Actualice Slurm a la 23.11.7 (desde la 23.11.4).

  • Para obtener más información, consulte la siguiente. CHANGELOG 3.9.2 GitHub

28 de mayo de 2024

AWS ParallelCluster Publicada la versión 3.9.1

Para actualizarla, introduzca lo siguiente: sudo pip install --upgrade aws-parallelcluster

Correcciones de errores

  • Quita la eliminación recursiva del almacenamiento compartido mountdir al desmontar sistemas de archivos como parte de la operación update-cluster.

11 de abril de 2024

AWS ParallelCluster publicada la versión 3.9.0

Para actualizarla, introduzca lo siguiente: sudo pip install --upgrade aws-parallelcluster

Mejoras:

  • Agrega el parámetro de configuración DeploymentSettings/DefaultUserHome para permitir a los usuarios mover el directorio de inicio predeterminado del usuario a /local/home en lugar de /home (predeterminado).

  • Permite actualizar los parámetros de configuración MinCount, MaxCount, Queue y ComputeResource sin necesidad de detener la flota de computación. Ahora es posible actualizarlos configurando Scheduling/SlurmSettings/QueueUpdateStrategy en TERMINATE. AWS ParallelCluster finalizará solo los nodos eliminados durante un cambio de tamaño de la capacidad del clúster que se lleve a cabo mediante una actualización del clúster.

  • Permite actualizar el almacenamiento compartido externo del tipo Efs, FsxLustre FsxOntap, FsxOpenZfs y FileCache sin reemplazar la flota de procesamiento e inicio de sesión.

  • Agregue soporte para RHEL9.

  • Añade compatibilidad con Rocky Linux 9 al crear CustomAmi a través del proceso build-image. En este momento no hay disponible ninguna AMI pública oficial de AWS ParallelCluster Rocky9 para Linux.

  • Elimine la configuración personalizada CommunicationParameters de Slurm de la lista de rechazados.

  • Se admite agregar un DeploymentSettings/DisableSudoAccessForDefaultUser parámetro para deshabilitar el acceso sudo del usuario predeterminado. OSes

  • Cambios en FSx los sistemas de archivos Lustre creados por ParallelCluster: Cambie la versión del servidor Lustre a 2.15.

  • Añade la posibilidad de elegir entre controladores Nvidia de código abierto y cerrado al crear una AMI mediante el atributo de nodo ['cluster']['nvidia']['kernel_open'] del libro de recetas.

  • * Añade una opción de configuración clustermgtd ec2_instance_missing_max_count para permitir una cantidad configurable de reintentos para que, eventualmente, las instancias de Amazon EC2 describe sean coherentes con las instancias en ejecución.

Cambios

  • Actualice Slurm a la versión 23.11.4 (desde la 23.02.7).

  • Actualiza el controlador NVIDIA a la versión 535.154.05.

  • Agregue soporte para Python 3.11, 3.12 en pcluster CLI y. aws-parallelcluster-batch-cli

  • Cree interfaces de red utilizando el índice de tarjetas de red de la NetworkCardIndex lista de EC2 DescribeInstances respuestas de Amazon, en lugar de rebasar el MaximumNetworkCards rango.

  • No se puede crear el clúster cuando se utilizan los tipos de instancia P3, G3, P2 y G2 porque su arquitectura de GPU no es compatible con los controladores de código abierto de Nvidia (OpenRM) introducidos como parte de la versión 3.8.0.

  • Actualiza las dependencias de libro de recetas de terceros: nfs-5.1.2 (desde nfs-5.0.0)

  • Actualiza el instalador de EFA a 1.30.0.

    • Efa-driver: efa-2.6.0-1

    • Efa-config: efa-config-1.15-1

    • Efa-profile: efa-profile-1.6-1

    • Libfabric-aws: libfabric-aws-1.19.0

    • Rdma-core: rdma-core-46.0-1

    • Open MPI: openmpi40-aws-4.1.6-2 y openmpi50-aws-5.0.0-11

  • Actualiza NICE DCV a la versión 2023.1-16388.

    • server: 2023.1.16388-1

    • xdcv: 2023.1.565-1

    • gl: 2023.1.1047-1

    • web_viewer: 2023.1.16388-1

Correcciones de errores

  • Se ha solucionado un problema que hacía que el trabajo fallara cuando se enviaba como usuario de Active Directory desde los nodos de inicio de sesión. El problema se debía a una configuración incompleta de la integración con el Active Directory externo del nodo principal.

  • Refactoriza las políticas de IAM definidas en la CloudFormation plantilla parallelclutser-policies.yaml para evitar errores en el despliegue de las API provocados por políticas que superen los límites de IAM. ParallelCluster

  • Se ha solucionado un problema que provocaba que los nodos de inicio de sesión no arrancaran cuando el nodo principal tardaba más tiempo del esperado en escribir las claves.

Para obtener más información sobre los cambios, consulta los archivos del paquete en. CHANGELOG aws-parallelcluster-ui GitHub

5 de marzo de 2024

AWS ParallelCluster Publicada la versión 3.8.0

AWS ParallelCluster publicada la versión 3.8.0.

Mejoras:

  • Añada compatibilidad con Amazon EC2 Capacity Blocks para ML.

  • Añade compatibilidad con Rocky Linux 8 al crear CustomAmi a través del proceso build-image. En este momento no hay disponible ninguna AMI pública oficial de AWS ParallelCluster Rocky8 para Linux.

  • Agregue un Scheduling/ScalingStrategy parámetro para controlar la estrategia de escalado de clústeres que se utilizará al lanzar EC2 instancias de Amazon para los nodos de cómputo de Slurm. Los valores posibles son all-or-nothing, greedy-all-or-nothing y best-effort, con all-or-nothing como valor predeterminado.

  • Agregue un HeadNode/SharedStorageType parámetro para utilizar el almacenamiento EFS en lugar de las exportaciones NFS desde el volumen raíz del nodo principal para los recursos del sistema de archivos compartidos dentro del clúster: Intel ParallelCluster, Slurm y datos. /home Esta mejora reduce la carga en la red del nodo principal.

  • Permite el montaje /home como un EFS o un almacenamiento compartido FSx externo a través de la SharedStorage sección del archivo de configuración.

  • Añada un nuevo parámetro SlurmSettings/MungeKeySecretArn para permitir el uso de una clave MUNGE externa definida por el usuario de AWS Secrets Manager.

  • Añade un Monitoring/Alarms/Enabled parámetro para activar Amazon CloudWatch Alarms en el clúster.

  • Añada alarmas de nodo principal para supervisar las comprobaciones de EC2 estado de Amazon, el uso de la CPU y el estado general del nodo principal, y agréguelas al CloudWatch panel de control creado con el clúster.

  • Añada compatibilidad con las asociaciones de repositorios de datos cuando PERSISTENT_2 lo utilice como si DeploymentType fuera un archivo gestionado FSx para Lustre.

  • Agregue un Scheduling/SlurmSettings/Database/DatabaseName parámetro para permitir a los usuarios especificar un nombre personalizado para la base de datos del servidor de bases de datos que se utilizará para la contabilidad de Slurm.

  • InstanceType se convierte en un parámetro de configuración opcional cuando se configura CapacityReservationTarget/CapacityReservationId en el recurso de computación.

  • Añade la posibilidad de especificar un prefijo para las políticas y roles de IAM que cree la API de AWS ParallelCluster .

  • Añada la posibilidad de especificar un límite de permisos que se aplicará a las funciones y políticas de IAM creadas por la API. AWS ParallelCluster

Cambios

  • Actualice Slurm a la versión 23.02.7 (desde la 23.02.6).

  • Actualiza el controlador NVIDIA a la versión 535.129.03.

  • Actualiza CUDA Toolkit a la versión 12.2.2.

  • Usa los controladores de GPU NVIDIA de código abierto (OpenRM) como módulo del kernel de NVIDIA para Linux en lugar del módulos NVIDIA de código cerrado.

  • Elimine la compatibilidad con el parámetro de all_or_nothing_batch configuración en el programa de currículum de Slurm, en favor de la nueva configuración del clúster. Scheduling/ScalingStrategy

  • Cambia la convención de nomenclatura de las alarmas de clúster a '[nombre-del-cluster]-[nombre-del-componente]-[métrica]'.

  • Cambia los tipos de volúmenes de EBS predeterminados en las regiones ADC de gp2 a gp3, tanto en los volúmenes raíz como en los adicionales.

  • El límite de permisos opcional para la AWS ParallelCluster API ahora se aplica a todos los roles de IAM creados por la infraestructura de la API.

    • Actualiza el instalador de EFA a 1.29.1.

    • Efa-driver: efa-2.6.0-1

    • Efa-config: efa-config-1.15-1

    • Efa-profile: efa-profile-1.5-1

    • Libfabric-aws: libfabric-aws-1.19.0-1

    • Rdma-core: rdma-core-46.0-1

    • Open MPI: openmpi40-aws-4.1.6-1

  • Se admite GDRCopy la actualización a la versión 2.4 OSes, excepto en Centos 7, donde se usa la versión 2.3.1.

  • Actualiza aws-cfn-bootstrap a la versión 2.0-28.

  • Se agregó soporte para Python 3.10 pulgadas. aws-parallelcluster-batch-cli

Correcciones de errores

  • Se ha corregido la configuración de escalado incoherente tras la reversión de la actualización del clúster al modificar la lista de tipos de instancias declarados en los recursos de computación.

  • Se ha corregido la generación de claves SSH de los usuarios al cambiar de usuario sin privilegios de nodo raíz en clústeres integrados con un servidor LDAP externo mediante archivos de configuración de clústeres.

  • Se corrigió la desactivación del modo de ahorro de energía de Slurm al configurarlo. ScaledownIdletime = -1

  • Corrige la ruta codificada al directorio de instalación de Slurm en el script de Slurm Accounting. update_slurm_database_password.sh

19 de diciembre de 2023

AWS ParallelCluster Publicada la versión 3.7.2

AWS ParallelCluster publicada la versión 3.7.2.

Cambios:

  • Actualice Slurm a la 23.02.6.

25 de octubre de 2023

AWS ParallelCluster Publicada la versión 3.7.1

AWS ParallelCluster publicada la versión 3.7.1.

Cambios:

  • Actualice Slurm a la 23.02.5 (desde la 23.02.4).

    • Actualiza Pmix a la versión 4.2.6 (desde la 3.2.3).

    • Actualiza libjwt a la versión 1.15.3 (desde la 1.12.0).

  • Actualiza el instalador EFA a la versión 1.26.1, con lo que se soluciona el problema de escritura de datos de RDMA en P5.

    • Efa-driver: efa-2.5.0-1.

    • Efa-config: efa-config-1.15-1.

    • Efa-profile: efa-profile-1.5-1.

    • Libfabric-aws: libfabric-aws-1.18.2-1.

    • ERdmardma-core-46.0-1-núcleo:.

    • Open MPI: openmpi40-aws-4.1.5-4.

22 de septiembre de 2023

AWS ParallelCluster publicada la versión 3.7.0

AWS ParallelCluster publicada la versión 3.7.0.

Mejoras:

  • Support la configuración de prioridades de nodos estáticas y dinámicas en los recursos informáticos mediante un archivo YAML de AWS ParallelCluster configuración.

  • Ofrece la compatibilidad con Ubuntu 22. De forma predeterminada, no se admiten las claves de RSA.

  • Incorpora el ajuste de configuración de colas JobExclusiveAllocation para asignar los nodos de una partición exclusivamente a un único trabajo en un momento dado.

  • Permite anular el paquete aws-parallelcluster-node en el momento de la creación y actualización del clúster. En el caso del nodo principal, esto se aplica a la actualización del clúster. Útil únicamente con fines de desarrollo.

  • Evita que el servidor NFS se inicie en los nodos de computación.

  • Ofrece compatibilidad con los nodos de inicio de sesión.

  • Permite la programación basada en la memoria cuando se especifican varios tipos de instancias para un recurso de computación de Slurm.

  • Ofrece compatibilidad para montar la caché de archivos de Amazon existente como almacenamiento compartido.

Cambios:

  • De forma predeterminada, asigne a los nodos dinámicos de Slurm una prioridad (peso) de 1000. De este modo, Slurm puede priorizar los nodos estáticos inactivos sobre los nodos dinámicos inactivos.

  • Haga que los aws-parallelcluster-node daemons solo AWS ParallelCluster manejen las particiones de Slurm administradas.

  • Aumenta el intervalo de sondeo de watchdog de EFS-utils a 10 segundos. Este cambio se aplica cuando EncryptionInTransit se establece en true, que es la única condición que hace que el watchdog se ejecute.

  • Actualiza el instalador de EFA a 1.25.1.

    • Efa-driver: efa-2.5.0-1 (desde efa-2.1.1g)

    • Efa-config: efa-config-1.15-1 (desde efa-config-1.13-1)

    • Efa-profile: efa-profile-1.5-1 (sin cambios)

    • Libfabric-aws: libfabric-aws-1.18.1-0 (desde libfabric-aws-1.17.1-1)

    • Rdma-core: rdma-core-46.0-1 (desde rdma-core-43.0-1)

    • Open MPI: openmpi40-aws-4.1.5-4 (desde openmpi40-aws-4.1.5-1)

  • Actualice Slurm a la versión 23.02.4.

  • Cambie el valor predeterminado de v1.0 Imds/ImdsSupport a v2.0.

  • Descarta Ubuntu 18.

  • Actualiza el tamaño predeterminado del volumen raíz a 40 GB para tener en cuenta los límites de CentOS 7.

  • Restringe los permisos del archivo /tmp/wait_condition_handle.txt dentro del nodo principal para que solo el usuario raíz pueda leerlo.

  • Crea un archivo JSON de asignación de partition-nodelist de Slurm para que los daemons del paquete de nodos lo utilicen para reconocer las particiones y listas de nodos de Slurm administradas por PC.

  • Actualiza el controlador NVIDIA a la versión 535.54.03.

  • Actualiza la biblioteca CUDA a la versión 12.2.0.

  • Actualiza NVIDIA Fabric Manager a nvidia-fabricmanager-535.

  • Actualiza ARM PL a la versión 23.04.1 solo para Ubuntu 22.04.

  • Actualiza NICE DCV a la versión 2023.0-15487.

    • Servidor: 2023.0.15487-1

    • xdcv: 2023.0.551-1

    • gl: 2023.0.1039-1

    • web_viewer: 2023.0.15487-1

Correcciones de errores:

  • Incorpora la validación del valor ScaledownIdletime para evitar que se establezca un valor inferior a −1.

  • Corrige un error de creación de clústeres con la AMI de aprendizaje profundo de Ubuntu en instancias de GPU con DCV habilitado.

  • Se ha solucionado el problema que provocaba que se crearan políticas de IAM pendientes al crear un proveedor de recursos ParallelCluster CloudFormation personalizado con. CustomLambdaRole

  • Corrige un problema que provoca una mala alineación del nombre de DNS de los nodos de computación en instancias con varias interfaces de red cuando SlurmSettings/Dns/UseEc2Hostnames se establecía en True.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes que contiene. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

30 de agosto de 2023

Publicación de la documentación únicamente

AWS ParallelCluster Se ha publicado la guía de usuario específica de la versión 3.

Publicación de la documentación únicamente:

  • AWS ParallelCluster la versión 3 tiene su propia guía de usuario independiente.

17 de julio de 2023

AWS ParallelCluster publicada la versión 3.6.1

AWS ParallelCluster publicada la versión 3.6.1.

Cambios:

  • Evite la duplicación de nodos que se ve clustermgtd si se añaden nodos de cómputo a varias particiones de Slurm.

Correcciones de errores:

  • Elimine el código fijo del nombre del dispositivo (/dev/sda1y/dev/xvda) del volumen raíz y recójalo del AMIs utilizado durante el proceso. create-cluster

  • Corrige el error de creación del clúster cuando se utiliza un recurso CloudFormation personalizado con el ElasticIp valor establecido enTrue.

  • Corrija los errores de creación y actualización del clúster cuando se utiliza un recurso AWS CloudFormation personalizado con archivos de configuración de gran tamaño.

  • Corrige un problema que impedía deshabilitar la protección ptrace en Ubuntu y que no permitía la conexión cruzada de memoria (CMA) en libfabric.

  • Corrige una lógica rápida de conmutación por error con una capacidad insuficiente cuando se utilizan varios tipos de instancias y no se devuelve ninguna instancia.

Para obtener información detallada sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes que contiene aws-parallelcluster-cookbook. aws-parallelcluster-node GitHub

5 de julio de 2023

AWS ParallelCluster publicada la versión 3.6.0

AWS ParallelCluster publicada la versión 3.6.0.

Documentación:

Mejoras:

  • Agregue soporte para RHEL8.

  • Agregue un recurso AWS CloudFormation personalizado para crear y administrar clústeres con CloudFormation.

  • Agregue soporte para personalizar la configuración de Slurm del clúster en el archivo YAML de AWS ParallelCluster configuración.

  • Cree Slurm con soporte para LUA.

  • Aumenta de 10 a 50 el límite máximo de colas por clúster. Cada cola puede tener un máximo de 50 recursos de computación. Cada clúster puede tener un máximo de 50 recursos de computación.

  • Ofrece compatibilidad para especificar una secuencia de varios scripts de acción personalizados para un evento configurado en los parámetros OnNodeStart, OnNodeConfigured y OnNodeUpdated.

  • Incorpora una nueva sección de configuración HealthChecks/Gpu, para aplicar las comprobaciones de estado de la GPU en un nodo de computación antes de ejecutar un trabajo.

  • Ofrece compatibilidad con Tags en la configuración de SlurmQueues y SlurmQueues/ComputeResources.

  • Ofrece compatibilidad con DetailedMonitoring en la configuración de Monitoring.

  • Agregue mem_used_percent disk_used_percent métricas para el seguimiento de la utilización del disco del volumen raíz y la memoria del nodo principal en el AWS ParallelCluster CloudWatch panel de control, y configure alarmas para monitorear estas métricas.

  • Ofrece compatibilidad con la rotación de registros para los registros administrados por AWS ParallelCluster .

  • Realice un seguimiento de los errores comunes de los nodos de cómputo y del tiempo de inactividad más prolongado de los nodos dinámicos en el CloudWatch panel de control.

  • Hace que el servidor de autenticación DCV utilice al menos un protocolo TLS-1.2 al crear el socket SSL.

  • Instala el paquete NVIDIA Data Center GPU Manager (DCGM) en todos los sistemas operativos compatibles, excepto aarch64, centos7 y alinux2.

  • Carga el módulo del kernel nvidia-uvm de forma predeterminada para proporcionar la funcionalidad de memoria virtual unificada (UVM) al controlador CUDA.

  • Instala NVIDIA Persistence Daemon como un servicio del sistema.

Cambios:

  • Actualice Slurm a la versión 23.02.2 (desde la versión22.05.8).

  • Actualiza munge a la versión 0.5.15 (desde la versión 0.5.14).

  • Establece el Slurm en 30TreeWidth.

  • Establezca el Slurm prolog y las epilog configuraciones en el directorio de destino y, respectivamente. /opt/slurm/etc/scripts/prolog.d/ /opt/slurm/etc/scripts/epilog.d/

  • Establezca Slurm en un máximo de 3 minutos BatchStartTimeout para ejecutar Prolog scripts durante el registro del nodo de cómputo.

  • Aumente el valor predeterminado RetentionInDays de CloudWatch los registros de 14 a 180 días.

  • Actualiza el instalador de EFA a 1.22.1.

    • Dkms: 2.8.3-2

    • Efa-driver: efa-2.1.1g (sin cambios)

    • Efa-config: efa-config-1.13-1 (sin cambios)

    • Efa-profile: efa-profile-1.5-1 (sin cambios)

    • Libfabric-aws: libfabric-aws-1.17.1-1 (desde libfabric-aws-1.17.0-1)

    • Rdma-core: rdma-core-43.0-1 (sin cambios)

    • Open MPI: openmpi40-aws-4.1.5-1 (sin cambios)

  • Actualiza la versión del cliente de Lustre a 2.12 en Amazon Linux 2. El cliente de Lustre 2.12 se ha instalado en Ubuntu 20.04, 18.04 y CentOS >= 7.7.

  • Actualiza la versión del cliente de Lustre a 2.10.8 en CentOS 7.6.

  • Actualiza el controlador NVIDIA a la versión 470.182.03 (desde la versión 470.141.03).

  • Actualiza NVIDIA Fabric Manager a la versión 470.182.03 (desde la versión 470.141.03).

  • Actualiza NVIDIA CUDA Toolkit a la versión 11.8.0 (desde la versión 11.7.1).

  • Actualiza la muestra de NVIDIA CUDA a la versión 11.8.0.

  • Actualiza la biblioteca MPI de Intel a la versión 2021, actualización 9 (desde la versión 2021, actualización 6). Para obtener más información, consulte Intel® MPI Library 2021, actualización 9.

  • Actualiza NICE DCV a la versión 2023.0-15022 (desde la versión 2022.2-14521).

    • server: 2023.0.15022-1 (desde la versión 2022.2-14521-1).

    • xdcv: 2023.0.547-1 (desde la versión 2022.2.519-1).

    • gl: 2023.0.1027-1 (desde la versión 2022.2.1012-1).

    • web_viewer: 2023.0.15022-1 (desde la versión 2022.2.14521-1).

  • Actualiza aws-cfn-bootstrap a la versión 2.0-24.

  • Actualice la imagen utilizada por el CodeBuild entorno al crear imágenes de contenedores para clústeres de AWS Batch:

    • aws/codebuild/amazonlinux2-x86_64-standard:4.0 (desde aws/codebuild/amazonlinux2-x86_64-standard:3.0).

    • aws/codebuild/amazonlinux2-aarch64-standard:2.0 (desde aws/codebuild/amazonlinux2-aarch64-standard:1.0).

Correcciones de errores:

  • Corrija los validadores de grupos de seguridad FSx de red de Amazon EFS y Amazon para evitar informar de errores falsos.

  • Corrige el etiquetado que faltaba de los recursos creados por Generador de imágenes durante la operación build-image.

  • Corrige la política de actualización de MaxCount para realizar siempre comparaciones numéricas en la propiedad MaxCount.

  • Corrige la alineación de IP en las instancias de nodos de computación con varias tarjetas de red.

  • Se corrige el problema slurm_parallelcluster_slurmdbd.conf cuando se actualiza un parámetro de StoragePass cola y no se actualizan las configuraciones de contabilidad de Slurm.

  • Corrige el problema que provocaba la creación de grupos de seguridad suspendidos al crear un clúster con un sistema de archivos EFS existente.

  • Corrige el problema que provocaba que el daemon de cfn-hup fallara al reiniciarse.

  • Considere los nodos dinámicos marcados INVALID_REG como errores de arranque en el modo protegido de Slurm. Los nodos estáticos que no se registran en Slurm ya se consideran errores de arranque después del. node_replacement_timeout

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes correspondientes. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

22 de mayo de 2023

AWS ParallelCluster publicada la versión 3.5.1

AWS ParallelCluster publicada la versión 3.5.1.

Mejoras:

Cambios:

  • Actualiza el instalador de EFA a 1.22.0.

    • Efa-driver: efa-2.1.1g (desde efa-2.1.1-1)

    • Efa-config: efa-config-1.13-1 (desde efa-config-1.12-1)

    • Efa-profile: efa-profile-1.5-1 (sin cambios)

    • Libfabric-aws: libfabric-aws-1.17.0-1 (desde libfabric-aws-1.16.1amzn3.0-1)

    • Rdma-core: rdma-core-43.0-1 (sin cambios)

    • Open MPI: openmpi40-aws-4.1.5-1 (desde openmpi40-aws-4.1.4-3)

    Actualiza NICE DCV a la versión 2022.2-14521.

    • server: 2022.2.14521-1

    • xdcv: 2022.2.519-1

    • gl: 2022.2.1012-1

    • web_viewer: 2022.2.14521-1

Correcciones de errores:

  • Corrige posibles errores de lanzamiento de nodos provocados por la coincidencia de patrones entre MountDir y /etc/exports al eliminar los volúmenes compartidos de Amazon EBS como parte de una actualización del clúster.

  • Evita el truncamiento de los archivos de registro compute_console_output en cada iteración clustermgtd.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes correspondientes. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

29 de marzo de 2023

AWS ParallelCluster publicada la versión 3.5.0

AWS ParallelCluster publicada la versión 3.5.0.

Mejoras:

  • Permite acceder a los clústeres y administrarlos con la interfaz de usuario de AWS ParallelCluster.

  • Agregue AWS ParallelCluster políticas versionadas en una CloudFormation plantilla a la que pueda hacer referencia en sus cargas de trabajo.

  • Agrega una biblioteca de AWS ParallelCluster Python que puedas usar con tu propio código.

  • Añada el registro de la salida de la consola de Compute Node a Amazon CloudWatch en caso de error de arranque del nodo de cómputo.

  • Añade un campo de errores que contiene el código y el motivo del error a la salida de describe-cluster cuando se produce un error en la creación del clúster.

  • Agrega validadores para evitar la inyección de cadenas malintencionada al llamar al módulo de subproceso.

  • No se puede crear el clúster si el estado del clúster cambia a PROTECTED cuando se aprovisionan nodos estáticos.

Cambios:

  • Actualice a la versión Slurm (desde la versión22.05.8) 22.05.7

  • Actualiza el instalador de EFA a 1.21.0.

    • Efa-driver: efa-2.1.1-1 (desde efa-2.1)

    • Efa-config: efa-config-1.12-1 (desde efa-config-1.11-1)

    • Efa-profile: efa-profile-1.5-1 (sin cambios)

    • Libfabric-aws: libfabric-aws-1.16.1amzn3.0-1 (desde libfabric-aws-1.16.1)

    • Rdma-core: rdma-core-43.0-1 (desde rdma-core-43.0-2)

    • Open MPI: openmpi40-aws-4.1.4-3 (sin cambios)

  • Haga que los registros del controlador Slurm sean más detallados y habilite el registro adicional para el complemento de ahorro de energía de Slurm.

Correcciones de errores:

  • Corrija la creación de la base de datos del clúster verificando que el nombre del clúster no tenga más de 40 caracteres cuando la contabilidad de Slurm esté habilitada.

  • Se solucionó un problema clustermgtd que provocaba que los nodos de cómputo, reiniciados mediante Slurm, se reemplazaran si fallaban las comprobaciones de estado de las EC2 instancias de Amazon.

  • Corrige un problema que impedía el lanzamiento de nodos de computación, con reservas de capacidad compartidas por otras cuentas, debido a una política de IAM incorrecta en el nodo principal.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes incluidos en él. aws-parallelcluster-cookbookaws-parallelcluster-nodeaws-parallelcluster-ui GitHub

20 de febrero de 2023

AWS ParallelCluster publicada la versión 3.4.1

AWS ParallelCluster publicada la versión 3.4.1.

Correcciones de errores:

  • Se ha corregido un problema del programador de Slurm que podía provocar una aplicación incorrecta de las actualizaciones en su registro interno de nodos de cómputo. Como consecuencia de este problema, las EC2 instancias podrían dejar de estar disponibles o estar respaldadas por un tipo de instancia incorrecto.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes correspondientes aws-parallelcluster-cookbook. aws-parallelcluster-node GitHub

13 de enero de 2023

AWS ParallelCluster publicada la versión 3.4.0

AWS ParallelCluster publicada la versión 3.4.0.

Mejoras:

  • Ofrece la compatibilidad para lanzar nodos en varias zonas de disponibilidad a fin de aumentar la disponibilidad de la capacidad.

  • Ofrece la compatibilidad para especificar varias subredes para cada cola a fin de aumentar la disponibilidad de la capacidad.

  • Agregue un nuevo parámetro de configuración en Iam/ResourcePrefixpara especificar un prefijo para la ruta y el nombre de los recursos de IAM creados por. AWS ParallelCluster

  • Añada una nueva sección de configuración DeploymentSettings/LambdaFunctionsVpcConfigpara especificar la configuración de Vpc utilizada por las funciones de AWS ParallelCluster Lambda.

  • Ofrece la posibilidad de especificar un script personalizado para que se ejecute en el nodo principal durante una actualización del clúster. El script se puede especificar con HeadNode/CustomActions/OnNodeUpdatedcuando se utiliza Slurm como programador.

Cambios:

  • Elimina la creación de objetivos de montaje de Amazon EFS para los sistemas de archivos existentes.

  • Monta los sistemas de archivos EFS mediante amazon-efs-utils. Los sistemas de archivos EFS se pueden montar mediante cifrado en tránsito y mediante un usuario autorizado de IAM.

  • Instale stunnel 5.67 en Cent OS7 y Ubuntu para admitir el cifrado en tránsito de EFS.

  • Actualiza el instalador de EFA a 1.20.0 (desde 1.18.0).

    • Efa-driver: efa-2.1 (desde efa-1.16.0-1)

    • Efa-config: efa-config-1.11-1 (sin cambios)

    • Efa-profile: efa-profile-1.5-1 (sin cambios)

    • Libfabric-aws: libfabric-aws-1.16.1 (desde libfabric-aws-1.16.0~amzn4.0-1)

    • Rdma-core: rdma-core-43.0-2 (desde rdma-core-41.0-2)

    • Open MPI: openmpi40-aws-4.1.4-3 (desde openmpi40-aws-4.1.4-2)

  • Actualiza Slurm a la versión 22.05.7 (desde 22.05.5).

  • Actualiza Python a 3.9.16 y 3.7.16 (desde 3.9.15 y 3.7.13).

  • Con Slurm22.05.7, los nodos dinámicos en IDLE+CLOUD+COMPLETING+POWER_DOWN+NOT_RESPONDING estado no se consideran insalubres.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y sus paquetes. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

22 de diciembre de 2022

AWS ParallelCluster publicada la versión 3.3.1

AWS ParallelCluster publicada la versión 3.3.1.

Cambios:

  • AMIs Los AWS ParallelCluster productos oficiales ya están disponibles después de que Amazon dejara de estar en EC2 desuso hace dos años.

  • Aumente el tamaño de la memoria de la AWS ParallelCluster API Lambda a 2048 para reducir las penalizaciones por arranque en frío y evitar tiempos de espera.

Correcciones de errores:

  • Evite la sustitución de los sistemas de archivos gestionados FSx por Lustre y la pérdida de datos en las actualizaciones del clúster que incluyan cambios en el ID de subred de la flota de procesamiento.

  • La DeletionPolicy de SharedStorage se aplica a las acciones de actualización de clústeres.

Para obtener más información sobre los cambios, consulta el CHANGELOG archivo del paquete aws-parallelcluster en. GitHub

2 de diciembre de 2022

AWS ParallelCluster solo documentación: hpc6id (nota)

AWS ParallelCluster actualización solo para documentación

  • AWS ParallelCluster no admite el tipo de instancia hpc6id para la configuración/. HeadNodeInstanceType

2 de diciembre de 2022

AWS ParallelCluster publicada la versión 3.1.5

AWS ParallelCluster publicada la versión 3.1.5.

Mejoras:

  • Corrige el problema de Slurm que impedía la finalización de los nodos inactivos.

  • Actualiza el instalador de EFA a 1.18.0.

    • Efa-driver: efa-1.16.0-1

    • Efa-config: efa-config-1.11-1 (desde efa-config-1.9-1)

    • Efa-profile: efa-profile-1.5-1 (sin cambios)

    • Libfabric-aws: libfabric-aws-1.16.0~amzn4.0-1 (desde libfabric-1.13.2)

    • Rdma-core: rdma-core-41.0-2 (desde rdma-core-37.0)

    • Open MPI: openmpi40-aws-4.1.4-2 (desde openmpi40-aws-4.1.1-2)

Cambios:

  • Añada lambda:ListTags y añada lo lambda:UntagResource que ParallelClusterUserRole utiliza la pila de AWS ParallelCluster API para actualizar el clúster.

  • Actualiza la biblioteca MPI de Intel a la versión 2021, actualización 6 (desde la versión 2021, actualización 4). Para obtener más información, consulte Intel® MPI Library 2021, actualización 6.

  • Actualiza el controlador NVIDIA a la versión 470.141.03 (desde 470.103.01).

  • Actualiza NVIDIA Fabric Manager a la versión 470.141.03 (desde 470.103.01).

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y sus paquetes aws-parallelcluster-cookbook. aws-parallelcluster-node GitHub

16 de noviembre de 2022

AWS ParallelCluster publicada la versión 3.3.0

AWS ParallelCluster publicada la versión 3.3.0.

Mejoras:

  • Agregue soporte para la configuración de asignación de múltiples instancias para un recurso de cómputo cuando utilice Slurm como programador. Para obtener más información, consulte Asignación de varios tipos de instancias con Slurm.

  • Ofrece la compatibilidad para agregar y eliminar SharedStorage con una actualización del clúster, utilizando una configuración actualizada. Para obtener más información, consulte Almacenamiento compartido.

  • Agregue un nuevo parámetro de configuración DeletionPolicy para los Efs y los ajustes de almacenamiento FsxLustrecompartido para permitir la retención del almacenamiento.

  • Añada compatibilidad con la contabilidad de Slurm con el nuevo parámetro de configuración Scheduling SlurmSettings//Database. Para obtener más información, consulte Contabilidad de Slurm con. AWS ParallelCluster

  • Ofrece la compatibilidad de reservas de capacidad bajo demanda (ODCR) y grupos de recursos de reserva de capacidad. Para obtener más información, consulte Lanzar instancias con reservas de capacidad bajo demanda (ODCR).

  • Agregue un nuevo parámetro de configuración para especificar la versión de IMDS que se va a admitir en un clúster o cree una infraestructura de imágenes en las configuraciones del clúster (Imds/ImdsSupport) y compile (Imds/). ImdsSupport

  • Agregue soporte para redes/PlacementGroupen la SlurmQueuessección/. ComputeResources

  • Ofrece la compatibilidad para instancias con múltiples interfaces de red que estén limitadas a un solo ENI por dispositivo.

  • Mejora la validación de las redes para los sistemas de archivos Amazon EFS externos comprobando el bloque CIDR en el grupo de seguridad asociado.

  • Agrega un validador para comprobar si los tipos de instancias configurados admiten grupos de ubicación.

  • Configura los subprocesos de NFS para que sean min(256, max(8, num_cores * 4)) a fin de garantizar una mejor estabilidad y rendimiento.

  • Mueve la instalación de NFS en el momento de la compilación para reducir el tiempo de configuración.

  • Habilita el cifrado del lado del servidor para el tema de EcrImageBuilder SNS que se crea al implementar la AWS ParallelCluster API y se usa para notificar los eventos de creación de imágenes de docker.

Cambios:

  • Cambie el comportamiento de/Networking SlurmQueues//. PlacementGroupEnabled Ahora crea un grupo de ubicaciones administradas único para cada recurso de computación en lugar de un único grupo de ubicaciones administradas para todos los recursos de computación.

  • Agregue soporte para SlurmQueues/Networking/PlacementGroup/Name como método de nomenclatura preferido.

  • Mueve las etiquetas del nodo principal desde la plantilla de lanzamiento hasta la definición de la instancia para evitar la sustitución del nodo principal en las actualizaciones de etiquetas.

  • Deshabilita el subprocesamiento múltiple mediante un script ejecutado por cloud-init y no a través de las CpuOptions establecidas en la plantilla de lanzamiento.

  • Actualice Python a la versión 3.9 y NodeJS a la versión 16 en la infraestructura de API, el contenedor de Docker de la API y los recursos Lambda del clúster.

  • Elimina la compatibilidad de Python 3.6 en aws-parallelcluster-batch-cli.

  • Actualiza Slurm a la versión 22.05.5 (desde 21.08.8-2).

  • Actualiza el controlador NVIDIA a la versión 470.141.03 (desde 470.129.06).

  • Actualiza NVIDIA Fabric Manager a la versión 470.141.03 (desde 470.129.06).

  • Actualiza NVIDIA CUDA Toolkit a la versión 11.7.1 (from 11.4.4).

  • Actualice Python utilizado en AWS ParallelCluster virtualenvs de a. 3.7.13 3.9.15

  • Actualiza el instalador de EFA a la versión 1.18.0.

    • Efa-driver: efa-1.16.0-1 (sin cambios)

    • Efa-config: efa-config-1.11-1 (from efa-config-1.10-1)

    • Efa-profile: efa-profile-1.5-1 (sin cambios)

    • Libfabric-aws: libfabric-aws-1.16.0~amzn4.0-1 (desde libfabric-aws-1.16.0~amzn2.0-1)

    • Rdma-core: rdma-core-41.0-2 (desde rdma-core-37.0)

    • Open MPI: openmpi40-aws-4.1.4-2 (desde openmpi40-aws-4.1.1-2)

  • Actualiza NICE DCV a la versión 2022.1-13300 (desde 2022.0-12760).

  • Habilita la supresión del formulario de SingleSubnetValidator para Queues.

  • No sustituye los nodos DRAIN cuando están en estado COMPLETING, ya que es posible que Epilog siga ejecutándose.

Correcciones de errores:

  • Se corrigió el error de validación del parámetro de filtros del AWS ParallelCluster ListClusterLogStreams comando cuando se pasaban filtros incorrectos.

  • Se corrigió el error EfsSettingsal validar el parámetro SharedStorage/cuando FileSystemId se especificaba junto con otros EfsSettingsparámetros SharedStorage/. Anteriormente, FileSystemId no estaba incluido.

  • Corrige la actualización del clúster al cambiar el orden de SharedStorage junto con otros cambios en la configuración.

  • Se ha corregido un error UpdateParallelClusterLambdaRole en la AWS ParallelCluster API para cargar los registros CloudWatch.

  • Corrige el error de que Cinc no utilizara el paquete de certificados de CA locales al instalar los paquetes antes de ejecutar cualquier libro de recetas.

  • Corrige un problema al actualizar Ubuntu con pcluster build-image cuando se establece Build:UpdateOsPackages:Enabled:true.

  • Corrige el error al analizar la configuración del clúster YAML al duplicar las claves.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes que contiene aws-parallelcluster-cookbook. aws-parallelcluster-node GitHub

2 de noviembre de 2022

AWS ParallelCluster solo se agregó una referencia a la API en la documentación.

AWS ParallelCluster actualización solo para la documentación

27 de octubre de 2022

AWS ParallelCluster Publicada la versión 3.2.1

AWS ParallelCluster publicada la versión 3.2.1.

Mejoras:

  • Mejore la lógica para asociar las tablas de enrutamiento del host a las diferentes tarjetas de red para soportar mejor las EC2 instancias de Amazon con varias NICs.

Cambios:

  • Actualiza el controlador NVIDIA a la versión 470.141.03.

  • Actualiza NVIDIA Fabric Manager a la versión 470.141.03.

  • Deshabilita las tareas man-db y mlocate del trabajo cron, ya que pueden tener un impacto negativo en el rendimiento del nodo.

  • Actualiza la biblioteca MPI de Intel a la versión 2021.6.0.602.

  • Actualiza Python de la versión 3.7.10 a la 3.7.13 en respuesta a este riesgo de seguridad.

Correcciones de errores:

  • Evita que se produzca un error en DescribeCluster cuando la configuración del clúster no esté disponible.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y sus paquetes aws-parallelcluster-cookbook. aws-parallelcluster-node GitHub

3 de octubre de 2022

AWS ParallelCluster publicada la versión 3.2.0

AWS ParallelCluster publicada la versión 3.2.0.

Mejoras:

Cambios:

  • Actualiza el instalador de EFA a la versión 1.17.2.

    • Controlador de EFA: efa-1.16.0-1

    • Configuración de EFA: efa-config-1.10-1

    • Perfil de EFA: efa-profile-1.5-1

    • Libfabric: libfabric-aws-1.16.0~amzn2.0-1

    • Núcleo de RDMA: rdma-core-41.0-2

    • Open MPI: openmpi40-aws-4.1.4-2

  • Actualiza NICE DCV a la versión 2022.0-12760.

  • Actualiza el controlador NVIDIA a la versión 470.129.06.

  • Actualiza NVIDIA Fabric Manager a la versión 470.129.06.

  • Cambia los tipos de volúmenes de EBS predeterminados de gp2 a gp3 tanto en los volúmenes raíz como en los adicionales.

  • Cambios FSx para los sistemas de archivos Lustre creados por: AWS ParallelCluster

    • Cambia el tipo de implementación predeterminado a Scratch_2.

    • Cambia la versión del servidor de Lustre a 2.12.

  • No es necesario configurar PlacementGroup/Enabled true al pasar unPlacementGroup/Idexistente.

  • No permite establecer PlacementGroup/Id cuando PlacementGroup/Enabled está explícitamente establecido en false.

  • Agrega una etiqueta parallelcluster:cluster-name a todos los recursos creados por AWS ParallelCluster.

  • Agregue lambda:ListTags y ParallelClusterUserRole utilice lambda:UntagResource la pila de AWS ParallelCluster API para la actualización del clúster.

  • Restrinja el IPv6 acceso únicamente IMDS a los usuarios administradores raíz y del clúster cuando el parámetro de configuración HeadNodeImds//Securedesté habilitado.

  • Con una AMI personalizada, utilice el tamaño del volumen raíz de la AMI en lugar del tamaño ParallelCluster predeterminado de 35 GiB. El valor se puede cambiar en el archivo de configuración del clúster.

  • Deshabilita automáticamente la flota de computación cuando el parámetro de configuraciónScheduling/SlurmQueues/ComputeResources/SpotPrice es menor que el precio mínimo requerido de cumplimiento de solicitud de Spot.

  • Muestra los valores requested_value y current_value del conjunto de cambios al añadir o eliminar una sección durante una actualización.

  • Deshabilite el aws-ubuntu-eni-helper servicio, disponible en Deep Learning AMIs, para evitar conflictos configure_nw_interface.sh al configurar instancias con varias tarjetas de red.

  • Elimina la compatibilidad de Python 3.6.

  • Establece la MTU en 9001 para todas las interfaces de red al configurar instancias con varias tarjetas de red.

  • Elimina el punto final al configurar el FQDN del nodo de computación.

  • Administra los nodos estáticos en POWERING_DOWN.

  • No reemplaza el nodo dinámico en POWER_DOWN, ya que es posible que los trabajos sigan ejecutándose.

  • Reinicia los daemons de clustermgtd y slurmctld en el momento de la actualización del clúster solo cuando se actualizan los parámetros de Scheduling en la configuración del clúster.

  • Actualiza slurmctld y los archivos de mantenimiento slurmd y systemd.

  • Restrinja el IPv6 acceso al IMDS solo a los usuarios administradores de clústeres y root cuando el parámetro de configuraciónHeadNode/Imds/Securedesté habilitado.

  • Establece la configuración de Slurm AuthInfo=cred_expire=70 para reducir el tiempo que deben esperar los trabajos en cola antes de volver a empezar cuando los nodos no estén disponibles.

  • Actualiza las dependencias de libros de recetas de terceros:

    • apt-7.4.2 (desde apt-7.4.0)

    • line-4.5.2 (desde line-4.0.1)

    • openssh-2.10.3 (desde openssh-2.9.1)

    • pyenv-3.5.1 (desde pyenv-3.4.2)

    • selinux-6.0.4 (desde selinux-3.1.1)

    • yum-7.4.0 (desde yum-6.1.1)

    • yum-epel-4.5.0 (desde yum-epel-4.1.2)

Correcciones de errores:

  • Corrija el comportamiento predeterminado para omitir los pasos de AWS ParallelCluster validación y prueba al crear una AMI personalizada.

  • Corrige la filtración del identificador del archivo en computemgtd.

  • Se corrigió una condición de carrera que provocaba que, de forma esporádica, las instancias lanzadas se cancelaran inmediatamente porque aún no estaban disponibles en la EC2 DescribeInstances respuesta.

  • Corrige la compatibilidad del parámetro DisableSimultaneousMultithreading en los tipos de instancias con procesadores Arm.

  • Corrige un error en la actualización de la pila de AWS ParallelCluster API al actualizar desde una versión anterior. Agrega el patrón de recursos utilizado para la acción ListImagePipelineImages en el EcrImageDeletionLambdaRole.

  • Se AWS ParallelCluster corrigió la API que añadía los permisos faltantes necesarios para importar o exportar desde Amazon S3 al crear un sistema de archivos FSx para Lustre.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes que contiene. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

27 de julio de 2022

AWS ParallelCluster actualizaciones solo de la documentación de este año hasta la fecha

AWS ParallelCluster actualizaciones exclusivas de la documentación.

Nuevas secciones:

Actualizaciones de secciones:

6 de julio de 2022

AWS ParallelCluster Lanzamiento de la versión 3.1.4

AWS ParallelCluster publicada la versión 3.1.4.

Mejoras:

  • Agrega la validación para DirectoryService/PasswordSecretArn para que falle si el secreto no existe.

    Ofrece la compatibilidad para habilitar la autenticación JWT en Slurm.

Cambios:

  • Actualiza Slurm a la versión 21.08.8-2.

  • Crea la compatibilidad de Slurm con JWT.

  • No requiere que se active PlacementGroup/trueal pasar unPlacementGroup/Idexistente para configurarlo.

  • lambda:TagResourceAñádelo a la pila de ParallelCluster API ParallelClusterUserRole utilizada para la creación de clústeres e imágenes.

Correcciones de errores:

  • Corrige la posibilidad de exportar los registros de un clúster cuando se utilizaba el comando export-cluster-logs con la opción --filters.

  • Corrija el punto de entrada de AWS Batch Docker para usar el directorio /home compartido para coordinar la ejecución del Multi-node-Parallel trabajo.

  • Restablezca la dirección del nodo al configurar el nodo estático en mal estado de Slurm como inactivo para evitar tratar el nodo estático que falló con una capacidad insuficiente como un nodo con una falla de arranque.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes correspondientes. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

16 de mayo de 2022

AWS ParallelCluster publicada la versión 3.1.3

AWS ParallelCluster publicada la versión 3.1.3.

Mejoras:

  • Ejecuta la creación de la clave SSH junto con la creación del directorio HOME, por ejemplo, al iniciar sesión con SSH, al cambiar a otro usuario y al ejecutar un comando como otro usuario.

  • Ofrece la compatibilidad de los nombres distintivos FQDN y LDAP en el parámetro de configuración DirectoryService/DomainName. El nuevo validador comprueba ahora ambas sintaxis.

  • El nuevo script update_directory_service_password.sh implementado en el nodo principal admite la actualización manual de la contraseña de Active Directory en la configuración de SSSD. AWS Secrets Manager recupera la contraseña a partir de la configuración del clúster.

  • Ofrece compatibilidad para implementar la infraestructura de API en entornos sin una VPC predeterminada.

Cambios:

  • Deshabilite los estados C más profundos en el x86_64 oficial AMIs y AMIs creado mediante build-image comandos, para garantizar un alto rendimiento y una baja latencia.

  • Actualizaciones del paquete del sistema operativo y correcciones de seguridad.

  • Cambie las imágenes base de Amazon Linux 2 para usarlas AMIs con Kernel 5.10.

Correcciones de errores:

  • Corrija la pila de imágenes de compilación DELETE_FAILED tras la creación correcta de la imagen, debido a las nuevas políticas de EC2 Image Builder.

  • Corrige la conversión del parámetro de configuración DirectoryService/DomainAddr a la propiedad ldap_uri de SSSD cuando contiene varias direcciones de dominio.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes correspondientes. aws-parallelcluster-cookbook GitHub

20 de abril de 2022

AWS ParallelCluster publicada la versión 3.1.2

AWS ParallelCluster publicada la versión 3.1.2.

Cambios:

  • Actualiza Slurm a la versión 21.08.6 (desde 21.08.5).

Correcciones de errores:

  • Corrige la actualización del archivo /etc/hosts en los nodos de computación cuando un clúster se implementa en subredes sin acceso a Internet.

  • Corrige el proceso de arranque de los nodos de computación para que esperen a que se inicialicen las unidades efímeras antes de unirse al clúster.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del paquete aws-parallelcluster en. GitHub

2 de marzo de 2022

AWS ParallelCluster publicada la versión 3.1.1

AWS ParallelCluster publicada la versión 3.1.1.

  • Añada compatibilidad con entornos de clústeres de varios usuarios mediante la integración con los dominios de Active Directory (AD) administrados a través de AWS Directory Service.

  • Añada compatibilidad con UseEc2Hostnames en el archivo de configuración del clúster. Si se establece en true, usa los nombres de host EC2 predeterminados de Amazon (por ejemplo, ip-1-2-3-4) para los nodos de cómputo.

  • Ofrece compatibilidad para la creación de clústeres en subredes sin acceso a Internet.

  • Ofrece la compatibilidad de varios tipos de instancias de computación por cola.

  • Ofrece la compatibilidad de la programación de GPU con Slurm en instancias ARM con tarjetas NVIDIA.

  • Agregue indicadores abreviados para cluster-name (-n), region (-r), image-id (-i) ycluster-configuration/image-configuration(-c) a la AWS ParallelCluster CLI.

  • Agregue soporte para la NEW_CHANGED_DELETED opción del FSx parámetro Lustre AutoImportPolicy.

  • Agregue una parallelcluster:compute-resource-name etiqueta a EC2 LaunchTemplates los recursos utilizados por los nodos de cómputo.

  • Mejore los grupos de seguridad creados dentro del clúster para permitir las conexiones entrantes desde grupos de seguridad personalizados cuando se SecurityGroups especifiquen los parámetros para algunas and/or colas de nodos principales.

  • Instala los controladores NVIDIA y la biblioteca CUDA para ARM.

Cambios:

  • Actualiza Slurm a la versión 21.08.5 (desde 20.11.8).

  • Actualiza el complemento de Slurm a la versión 21.08 (desde 20.11).

  • Actualiza NICE DCV a la versión 2021.3-11591 (desde 2021.1-10851).

  • Actualiza el controlador NVIDIA a la versión 470.103.01 (desde 470.57.02).

  • Actualiza NVIDIA Fabric Manager a la versión 470.103.01 (desde 470.57.02).

  • Actualiza CUDA a la versión 11.4.4 (desde 11.4.0).

  • Intel MPI se ha actualizado a la versión 2021, actualización 4 (actualizado desde la versión 2019, actualización 8). Para obtener más información, consulte Intel® MPI Library 2021, actualización 4.

  • Actualice PMIx a la versión 3.2.3 (desde3.1.5).

  • Elimina el volcado de nodos de computación fallidos a /home/logs/compute. Los archivos de registro de los nodos de cómputo están disponibles en CloudWatch y en los registros de EC2 la consola de Amazon.

  • Habilita la posibilidad de suprimir los validadores de longitud SlurmQueues y ComputeResources.

  • Deshabilita la actualización del paquete en el momento del lanzamiento de la instancia en Amazon Linux 2.

  • Desactiva los metadatos de imagen EC2 ImageBuilder mejorados de Amazon al crear imágenes AWS ParallelCluster personalizadas.

  • Establezca explícitamente cloud-init la fuente de datos como. EC2 Esto ahorra tiempo de arranque para las plataformas Ubuntu y CentOS.

  • Use el nombre del recurso de computación en lugar del tipo de instancia en el nombre de la plantilla de lanzamiento de la flota de computación.

  • Redirige stderr y stdout al archivo de registro de CLI para evitar que aparezca texto no deseado en la salida de CLI del pcluster.

  • Mueva las configure/install recetas para separar los libros de cocina llamados del libro principal. Los puntos de entrada existentes se mantienen y son compatibles con versiones anteriores.

  • Descarga las dependencias de la plataforma Intel HPC durante el tiempo de creación de AMI para evitar el contacto con Internet durante la creación del clúster.

  • No elimina - del nombre del recurso de computación al configurar los nodos de Slurm.

  • No lo configure GPUs en Slurm cuando el controlador NVIDIA no esté instalado.

  • Corrige el permiso ecs:ListContainerInstances en BatchUserRole.

  • Corrige la exportación de los registros del clúster cuando no se especifica ningún prefijo, previamente exportados a un prefijo None.

  • Corrige el error de no realizar la reversión cuando se producía un error en la actualización del clúster.

  • Corrige el permiso ecs:ListContainerInstances en BatchUserRole.

  • Corrige el esquema RootVolume para HeadNode generando un error si se especifica un KmsKeyId no compatible.

  • Corrige las métricas FSx que faltaban en Amazon para que se mostraran en el CloudWatch panel de control.

  • Corrige EfaSecurityGroupValidator. Anteriormente, era posible que se produjeran errores falsos cuando se proporcionaban grupos de seguridad personalizados y se habilitaba la EFA.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y sus paquetes aws-parallelcluster-cookbook. aws-parallelcluster-node GitHub

10 de febrero de 2022

AWS ParallelCluster publicada la versión 3.0.3

AWS ParallelCluster publicada la versión 3.0.3.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y sus paquetes. aws-parallelcluster-cookbook GitHub

17 de enero de 2022

AWS ParallelCluster publicada la versión 3.0.2

AWS ParallelCluster publicada la versión 3.0.2.

Actualice el instalador del adaptador Elastic Fabric a la versión 1.14.1

  • Configuración de EFA: efa-config-1.9-1 (desde efa-config-1.9)

  • Perfil de EFA: efa-profile-1.5-1 (desde efa-profile-1.5)

  • Módulo Kernel de EFA: efa-1.14.2 (desde efa-1.13.0)

  • Núcleo de RDMA: rdma-core-37.0 (desde rdma-core-35)

  • Libfabric: libfabric-1.13.2 (desde libfabric-1.13.0)

  • Open MPI: openmpi40-aws-4.1.1-2 (sin cambios)

GPUDirect RDMA siempre está habilitado si el tipo de instancia lo admite. La opción GdrSupportde configuración no tiene ningún efecto.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes correspondientes. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

5 de noviembre de 2021

AWS ParallelCluster publicada la versión 3.0.1

AWS ParallelCluster publicada la versión 3.0.1.

Herramienta de migración de la configuración de clústeres

El nodo principal se puede detener

  • Tras detener la flota de procesamiento, se puede detener el nodo principal y reiniciarlo posteriormente mediante la EC2 consola de Amazon o el comando CLI stop-instances AWS .

Región predeterminada leída AWS del archivo ~/.aws/config

  • Para el comando pcluster, si la AWS región no se especifica en el archivo de configuración, en el entorno o en la línea de comandos, se utiliza la AWS región predeterminada especificada en la region configuración de la [default] sección del ~/.aws/config archivo.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes correspondientes. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

27 de octubre de 2021

AWS ParallelCluster publicada la versión 3.0.0

AWS ParallelCluster publicada la versión 3.0.0.

Compatibilidad de la administración de clústeres mediante Amazon API Gateway

  • Los clientes ahora pueden administrar e implementar clústeres a través de puntos de conexión HTTP con Amazon API Gateway. Esto abre nuevas posibilidades para los flujos de trabajo con scripts o basados en eventos.

    La interfaz de línea de AWS ParallelCluster comandos (CLI) también se ha rediseñado para que sea compatible con esta API e incluye una nueva opción de salida JSON. Esta nueva funcionalidad permite a los clientes implementar capacidades de componentes básicos similares también mediante la CLI.

Creación de AMI personalizadas mejorada

  • Los clientes ahora tienen acceso a un proceso más sólido para crear y gestionar la personalización AMIs mediante EC2 Image Builder. Ahora, la personalización se AMIs puede gestionar mediante un archivo de AWS ParallelCluster configuración independiente y se puede crear mediante el comando pcluster build-image de la interfaz de línea de AWS ParallelCluster comandos.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster y los paquetes que contiene. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

10 de septiembre de 2021

PCUI
Cambio Descripción Fecha

Publicada la versión 2025.04.0 de PCUI

Publicada la versión 2025.04.0 de la PCUI

Cambios de última hora:

  • Elimine el valor predeterminado de la versión para PC. Ahora el usuario debe especificar la versión de PC que va a utilizar.

Características:

  • Añada el nuevo parámetro de pila AdditionalPoliciesPCAPI '' para añadir permisos personalizados para la función de ParallelCluster API Lambda, además de los predeterminados.

Correcciones de errores:

  • Corrija el despliegue de la PCUI en subredes privadas haciendo que la plantilla de PCUI utilice y devuelva la correcta. URLs

  • Soluciona un problema que impedía cargar más de 200 trabajos en la pestaña Estado del trabajo. (Consulte https://github.com/aws/aws-parallelcluster-ui/issues/376).

Seguridad:

16 de abril de 2025

Publicada la versión 2024.11.0 de PCUI

Publicada la versión 2024.11.0 de la PCUI

Correcciones de errores:

  • Establezca de forma explícita la política de un repositorio privado de ECR para evitar que la eliminación de políticas en una actualización de pila afecte a una función de Lambda. La política incluye los permisos que requiere la función Lambda para obtener el código.

22 de noviembre de 2024

Publicada la versión 2024.10.0 de la PCUI

Publicada la versión 2024.10.0 de la PCUI

Cambios:

  • Añada compatibilidad con la versión 3.11.1. AWS ParallelCluster

  • Añada compatibilidad con las reservas de capacidad bajo demanda y el bloqueo de capacidad en el asistente.

  • Añada las familias g6, m7 y p5 a la lista de tipos de instancias compatibles en el asistente.

  • Añada nuevos parámetros opcionales de pila para configurar el dominio personalizado tanto para PCUI como para Cognito.

Correcciones de errores:

  • Corrige un error que estaba interrumpiendo la configuración del dominio personalizado.

Seguridad:

  • Actualice Flask-CORS de la versión 3.0.10 a la 4.0.2 para corregir la vulnerabilidad CVE-2024-6221.

  • Actualice lint-stage de 13.0.3 a 15.2.5 para solucionar la vulnerabilidad CVE-2024-4068.

  • Registro de cambios completo

22 de octubre de 2024

Publicación de la versión 2024.05.0 de la PCUI

Publicación de la versión 2024.05.0 de la PCUI.

Correcciones de errores:

  • Se ha corregido un error en el frontend que bloqueaba la interfaz de usuario cuando el usuario abría el panel Estado del trabajo.

  • Registro de cambios completo

14 de mayo de 2024

Publicación de la versión 2024.04.0 de la PCUI

Publicación de la versión 2024.04.0 de la PCUI.

Características:

17 de abril de 2024

Publicación de la versión 2024.03.0 de la PCUI

Publicación de la versión 2024.03.0 de la PCUI.

Características:

  • Se agregó soporte para la AWS ParallelCluster versión 3.9.0

  • Añade compatibilidad con Ubuntu 22.04 y Red Hat Enterprise Linux 9

  • Ubuntu 18.04 ha quedado en desuso

Correcciones de errores

  • Se ha corregido un problema que provocaba que algunos clústeres no aparecieran si se utilizaban muchos.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster-uipaquete en GitHub.

12 de marzo de 2024

Publicación de la versión 2024.02.0 de la PCUI

Publicación de la versión 2024.02.0 de la PCUI

Cambios:

  • Se ha actualizado el entorno de tiempo de ejecución de Lambda a Python versión 3.9

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster-uipaquete en GitHub.

8 de febrero de 2024

Publicación de la versión 2023.12.0 de la PCUI

Publicación de la versión 2023.12.0 de la PCUI.

Características:

  • Añade compatibilidad para la implementación de la PCUI con redes privadas.

  • Añade la posibilidad de aplicar opcionalmente un límite de permisos a cada rol de IAM creado por las infraestructuras de la PCUI y la PCAPI

  • Añade la posibilidad de aplicar opcionalmente un prefijo a cada política y rol de IAM creados por la infraestructura de la PCUI y la PCAPI.

  • Se agregó soporte para ParallelCluster la versión 3.8.0, sin paridad de funciones en el asistente.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster-uipaquete en. GitHub

21 de diciembre de 2023

Publicación de la versión 2023.10.0 de la PCUI

Publicación de la versión 2023.10.0 de la PCUI.

Características:

  • Se ha añadido compatibilidad con la ParallelCluster versión 3.7.2. La paridad de funciones del asistente se limita a la caché de FSx archivos y a la compatibilidad con la programación basada en la memoria con varios tipos de instancias.

Correcciones de errores:

  • Se ha corregido un problema que provocaba errores en la interfaz de usuario cuando la PCUI no tenía permisos para interactuar con Explorador de costos.

Mejoras

  • Mejora la seguridad al reducir el TTL del token de acceso de 10 a 5 minutos.

Para obtener más información sobre los cambios, consulta los CHANGELOG archivos del aws-parallelcluster-uipaquete en. GitHub

20 de octubre de 2023

Publicación de la versión 2023.06.0 de la PCUI

Publicación de la versión 2023.06.0 de la PCUI.

Cambios:

  • Se actualizó la versión predeterminada AWS ParallelCluster de la API a la 3.6.0.

Correcciones de errores:

  • Se corrigió un problema de implementación en la región AWS GovCloud (EE. UU.-Oeste).

  • El panel dividido ahora carga correctamente los detalles del clúster una vez iniciada la creación.

Notas:

  • La función de monitorización de costes no está disponible en las regiones AWS GovCloud (EE. UU.).

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster-uipaquete en GitHub.

7 de junio de 2023

Publicación de la versión 2023.05.0 de la PCUI

Publicación de la versión 2023.05.0 de la PCUI.

Mejoras:

  • A partir de AWS ParallelCluster la versión 3.6.0, añada soporte para RHEL 8.

  • Añade el monitoreo de los costes del clúster.

  • A partir de AWS ParallelCluster la versión 3.6.0, aumente las cuotas de recursos de procesamiento y colas.

Cambios:

  • Se ha mejorado la interfaz de usuario del asistente de creación de clústeres.

  • Se ha aumentado la velocidad de implementación de la PCUI.

  • Se ha mejorado la interfaz para añadir un nuevo usuario.

  • De forma predeterminada, las colas se encuentran en la subred del nodo principal.

Correcciones de errores:

  • Cambia a la región correcta una vez finalizada la creación del clúster.

  • Corrige la visualización del indicador de carga en la característica “Editar clúster”.

  • Corrija la creación de clústeres cuando se elimina la SnapshotId propiedad EBS.

Para obtener más información sobre los cambios, consulte los CHANGELOG archivos del aws-parallelcluster-uipaquete en GitHub cuestión.

16 de mayo de 2023

Publicación de la versión 2023.04.0 de la PCUI

Publicación de la versión 2023.04.0 de la PCUI.

Mejoras:

  • Rediseño del asistente de creación de clústeres.

  • Rediseño de la página de registros del clúster.

  • Agrega una configuración de nombre personalizado para el almacenamiento compartido.

  • Agrega una selección de almacenamiento múltiple al agregar almacenamiento a un clúster.

  • Añada DeletionPolicy compatibilidad con Amazon EFS y FSx Lustre.

  • Agrega el ajuste ImdsSupport a la configuración del clúster.

  • Ofrece la compatibilidad de tipos de instancias C7.

  • Se agregó el tutorial Cómo volver a una versión anterior del documento de AWS Systems Manager.

Cambios:

  • YAML de configuración de clúster de hasta 1 MB de tamaño.

  • La sesión del usuario no se ha cerrado debido a una autorización con credenciales temporales de IAM para Boto3.

  • Las opciones de subprocesos múltiples están deshabilitadas cuando se selecciona una instancia de HPC.

  • Se ha eliminado la opción de deshabilitar la reversión en la página de creación de clústeres.

  • Se impide que el usuario utilice la PCUI hasta que se proporcione la información requerida.

  • Se puede agregar un máximo de 10 colas.

  • El documento SSM-SessionManagerRunShell no se sobrescribe durante la instalación de la PCUI.

Correcciones de errores:

  • Corrige un enlace roto para restablecer la contraseña.

  • Corrige un error de delete stack causado por que EcrPrivateRepository no está vacío.

  • Se ha corregido el problema de inicialización de la casilla de verificación Generar claves SSH en la sección de propiedades de administración de varios usuarios.

  • Se ha corregido el bloqueo provocado por un trabajo con propiedades sin definir.

  • FSx Configuración de SCRATCH fija.

  • Se ha corregido el botón de instancias de inicio y detención, que seguía habilitado después de hacer clic una vez.

Para obtener más información sobre los cambios, consulta CHANGELOG los archivos aws-parallelcluster-uidel paquete GitHub.

17 de abril de 2023

Terraform
Cambio Descripción Fecha

Publicado Terraform Provider para la versión AWS ParallelCluster 1.1.0

Correcciones de errores:

  • Se ha corregido un problema que provocaba un error al aplicar terraform cuando se utilizaba la ParallelCluster API 3.11.x para implementar clústeres con nodos de inicio de sesión.

6 de diciembre de 2024

Publicado el módulo Terraform para la versión 1.1.0 AWS ParallelCluster

Cambios:

  • Utilice AWS ParallelCluster Terraform Provider 1.x en todos los ejemplos de módulos.

  • Utilice la ParallelCluster API 3.11.1 en todos los ejemplos con la API de nombre de pila. ParallelCluster

  • Implemente nodos de inicio de sesión en todos los ejemplos de módulos.

6 de diciembre de 2024

Lanzamiento de Terraform Provider para la versión AWS ParallelCluster 1.0.0

Características:

26 de junio de 2024

Publicado el módulo Terraform para la versión 1.0.0 AWS ParallelCluster

Características:

26 de junio de 2024