Versionshinweise und Dokumentenverlauf - AWS ParallelCluster

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Versionshinweise und Dokumentenverlauf

In den folgenden Tabellen werden die wichtigsten Updates und neuen Funktionen für das Benutzerhandbuch beschrieben.AWS ParallelCluster Wir aktualisieren die Dokumentation regelmäßig, um das Feedback, das Sie uns senden, einzuarbeiten.

AWS ParallelCluster
Änderung Beschreibung Datum

AWS ParallelCluster Version 3.13.2 veröffentlicht

Um ein Upgrade durchzuführen, geben Sie Folgendes ein:. sudo pip install --upgrade aws-parallelcluster

Fehlerbehebungen:

  • Behebt einen Fehler, der dazu führen update-cluster kannupdate-compute-fleet, dass Rechenressourcen auf eine abgelaufene Kapazitätsreservierung verweisen, auf die nicht mehr zugegriffen EC2 APIs werden kann.

  • Behebt einen build-image Fehler auf Rocky 9, der auftritt, wenn das übergeordnete Image nicht die neueste Kernel-Version mitliefert. Siehe https://github.com/aws/aws-parallelcluster/issues/6874.

24. Juni 2025

AWS ParallelCluster Version 3.13.1 veröffentlicht

Um ein Upgrade durchzuführen, geben Sie Folgendes ein:. sudo pip install --upgrade aws-parallelcluster

Änderungen:

  • Aktualisieren Sie Slurm auf Version 24.05.8.

  • Aktualisieren Sie das EFA-Installationsprogramm auf 1.41.0 (von 1.38.1).

    • EFA-Treiber: efa-2.15.0-1

    • EFA-Konfiguration: efa-config-1.18-1

    • EFA-Profil: efa-profile-1.7-1

    • libfabric-aws: libfabric-aws-2.1.0-1

    • RDMA-Kern: rdma-core-57.0-1

    • Öffnen Sie MPI: openmpi40-aws-4.1.7-2 und openmpi50-aws-5.0.6

  • Aktualisieren Sie amazon-efs-utils auf Version 2.3.1 (von v2.1.0) für Linux-AMIs, die nicht von Amazon stammen.

  • Support DCV in us-isob-east -1 und us-iso-east -1.

  • Support FSX für Lustre und Ontap in us-isob-east -1 und -1. us-iso-east

  • Stellen Sie die Kernel-Konsistenz während der gesamten ParallelCluster Image-Erstellung sicher, indem Sie die Fixierung am Anfang vornehmen und die Fixierung nach Abschluss wieder aufheben.

Fehlerbehebungen:

  • Behebt einen Fehler bei der Installation der ARM Performance Library, der dazu führte, dass das Build-Image in isolierten Umgebungen fehlschlug.

  • Behebt einen Fehler, der das Skript 'update_directory_service_password.sh' daran hinderte, das AD-Passwort zu aktualisieren.

04. Juni 2025

AWS ParallelCluster Version 3.13.0 veröffentlicht

Um ein Upgrade durchzuführen, geben Sie Folgendes ein:. sudo pip install --upgrade aws-parallelcluster

Veraltete Versionen:

  • Dies ist die letzte ParallelCluster Version, die Ubuntu 20.04 unterstützt, da Ubuntu 20.04 im Mai 2025 erscheinen wird. End-Of-Standard-Support

Verbesserungen:

  • Unterstützung für Ubuntu 24.04 hinzugefügt.

  • Unterstützung für die Region ap-Southeast-7 hinzugefügt.

  • Deaktivieren Sie die ungenutzten Dienste cups und wpa_supplicant von Official, um die Sicherheit zu erhöhen. ParallelCluster AMIs

Änderungen:

  • Aktualisieren Sie Slurm auf Version 24.05.7.

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 570.86.15 (von 550.127.08) für alle außer. OSs AL2

  • Aktualisieren Sie das CUDA Toolkit auf Version 12.8.0 (von 12.4.1) für alle außer. OSs AL2

  • Aktualisieren Sie Python auf 3.12.8 für alle OSs außer AL2 (von 3.9.20).

  • Installieren Sie unter Ubuntu 22.04 den Nvidia-Treiber mit derselben Compiler-Version, die zum Kompilieren des Kernels verwendet wurde.

  • Aktualisieren Sie aws-cfn-bootstrap auf Version 2.0-33.

  • Aktualisieren Sie das EFA-Installationsprogramm auf 1.38.0 (von 1.36.0).

    • EFA-Treiber: efa-2.13.0-1

    • EFA-Konfiguration: efa-config-1.17-1

    • EFA-Profil: efa-profile-1.7-1

    • Libfabric-aws: libfabric-aws-1.22.0-1

    • RDMA-Kern: rdma-core-54.0-1

    • MPI öffnen: und openmpi40-aws-4.1.7-1 openmpi50-aws-5.0.5

  • Führen Sie ein Upgrade amazon-efs-utils auf Version 2.1.0 durch.

  • Entfernen Sie das Kochbuch von Drittanbietern: apt-7.5.22 und pyenv-4.2.3.

  • Aktualisieren Sie die Abhängigkeiten von Drittanbieter-Kochbüchern:

    • Zeile 4.5.21 (von Zeile 4.5.13)

    • nfs-5.1.5 (von nfs-5.1.2)

    • openssh-2.11.14 (von openssh-2.11.12)

    • yum-7.4.20 (von yum-7.4.13)

    • yum-epel-5.0.8 (von yum-epel-5.0.2)

  • Aktualisieren Sie Pmix auf 5.0.6 (von 5.0.3).

  • Aktualisieren Sie ARM PL auf Version 24.10 (von 23.10).

  • Aktualisieren Sie Python im Lambda-Layer und im Installationsprogramm auf Version 3.12.8 (von 3.9.17).

  • Aktualisieren Sie NodeJS im Lambda-Layer und im Installationsprogramm auf Version 20.18.3 (von 18.20.3).

  • Entfernen Sie die Generierung von DSA-Schlüsseln für Anmeldeknoten als DSA, die in OpenSSH 9.7+ nicht mehr unterstützt wurde.

  • Legen Sie die Informationen zur Instanz-ID und zum Instanztyp in Slurm fest, wenn die Rechenknoten gestartet werden.

  • Installieren Sie NVIDIA-Treiber ohne die Option 'no-cc-version-check', die jetzt im NVIDIA-Installationsprogramm als veraltet gilt.

  • Fügen Sie einen Validator hinzu, um bis zu 10 Anmeldeknotenpools durchzusetzen.

  • Aktualisieren Sie die Standardgröße des Root-Volumes auf 45 GB.

Fehlerbehebungen:

  • Entfernen Sie die Verwendung von cfn-init für das Bootstrapping von Rechenknoten, um die Zeit für die Skalierung der Knoten zu reduzieren.

  • Behebt ein Problem, das bei Verwendung eines Proxys zu einem Ausfall des Compute-Knoten-Bootstraps führte.

  • Installieren Sie unter Ubuntu 22.04 den Nvidia-Treiber mit derselben Compiler-Version, mit der Sie den Kernel kompiliert haben, um Installationsfehler zu vermeiden.- Korrigieren Sie die Ausführung des überschreibenden aws-parallelcluster-node Pakets während des Updates nur auf dem Hauptknoten.

  • Behebt ein Problem, bei dem containerisierte Jobs, die Pyxis/Enroot in einer Mehrbenutzerumgebung (integriert in Active Directory) ausgeführt wurden, fehlschlagen würden.

  • Die Verwendung von Authselect wurde behoben, die auf Rocky 9.5+ zu Knoten-Bootstrap-Fehlern führte, wenn der Verzeichnisdienst verwendet wurde.

01. April 2025

AWS ParallelCluster Version 3.12.0 veröffentlicht

Um ein Upgrade durchzuführen, geben Sie Folgendes ein:. sudo pip install --upgrade aws-parallelcluster

Verbesserungen:

  • Fügen Sie einen neuen Abschnitt Build/Installation zur Build-Image-Konfiguration hinzu, um NVIDIA-Software- und Lustre-Client-Installationen ein- und auszuschalten. Standardmäßig wird NVIDIA-Software, obwohl sie in der offiziellen Version enthalten ist ParallelCluster AMIs, nicht von installiert. build-image Standardmäßig ist der Lustre-Client installiert.

  • Die CLI-Befehle export-cluster-logs und export-image-logs können jetzt standardmäßig die Protokolle in den ParallelCluster Standard-Bucket oder in den Customs3Bucket exportieren, sofern in der Konfiguration angegeben.

  • Erweitern Sie die Amazon DCV-Unterstützung auf Ubuntu2204 auf ARM-Instances.

Änderungen:

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 550.127.08 (von 550.90.07). Dies behebt ein bekanntes Problem von NVIDIA. Weitere Informationen finden Sie unter Bekannte Probleme in der NVIDIA Data Center-Dokumentation.

  • Führen Sie ein Upgrade von Amazon DCV auf Version 2024.0-18131 durch.

    • Server: 2024.0-18131-1

    • xdcv: 2024.0.631-1

    • gl: 2024.0.1078-1

    • Webviewer: 2024.0-18131-1

  • Aktualisieren Sie das EFA-Installationsprogramm auf. 1.36.0

    • EFA-Treiber: efa-2.13.0-1

    • EFA-Konfiguration: efa-config-1.17-1

    • EFA-Profil: efa-profile-1.7-1

    • libFabric-aws: libfabric-aws-1.22.0-1

    • RDMA-Kern: rdma-core-54.0-1

    • MPI öffnen: und openmpi40-aws-4.1.7-1 openmpi50-aws-5.0.5

  • Bei einem Fehler wird slurmctld automatisch neu gestartet.

  • Führen Sie ein Upgrade auf Version 8.0.39 durch. mysql-community-client

  • Entfernen Sie die Unterstützung für Python 3.7 und 3.8, deren Lebensdauer abgelaufen ist.

Fehlerbehebungen:

  • Behebt ein Problem, bei dem Änderungen in der Reihenfolge der Skripts für benutzerdefinierte Aktionen bei Cluster-Updates nicht erkannt wurden.

  • Fügen Sie fehlende Berechtigungen für die AWS ParallelCluster API hinzu, um die serviceverknüpften Rollen für Elastic Load Balancing und Auto Scaling zu erstellen, die für die Bereitstellung von Login-Knoten erforderlich sind.

  • Behebt ein Problem mit der Art und Weise, wie wir die Region bei der Verwaltung von Volumes ermitteln, sodass sie die lokale Zone korrekt verarbeiten kann.

  • Behebt ein Problem, bei dem das Hinzufügen von EFS-Dateisystemen mit AccessPointIds während eines Updates fehlschlagen würde.

  • Behebt ein Problem, bei dem bei Verwendung von PCAPI das Cluster-Update fehlschlagen konnte, wenn ein Parameter aktualisiert wurde, der nicht vom Typ ist String (z. B.). MaxCount

  • Beim Mounten eines externen OpenZFS ist es nicht mehr erforderlich, die Regeln für ausgehende Verbindungen für die Ports 111, 2049, 20001, 20002, 20003 festzulegen.

19. Dezember 2024

AWS ParallelCluster Version 3.11.1 veröffentlicht

Features:

  • Pyxis ist jetzt standardmäßig deaktiviert und muss daher manuell aktiviert werden, wie in der Produktdokumentation dokumentiert.

  • Aktualisieren Sie die Python-Laufzeit in ParallelCluster Lambda Layer auf Version 3.12.

  • Entfernen Sie das Versionspinning für Setuptools auf Versionen vor 70.0.0.

  • Aktualisieren Sie libjwt auf Version 1.17.0.

  • Vollständiges Changelog

Fehlerbehebungen

  • Behebt ein Problem bei der Konfiguration des Pyxis Slurm-Plug-ins ParallelCluster , das zu Fehlern bei der Auftragsübermittlung führen kann.

  • Beheben Sie ein Problem, das zu einer fehlgeschlagenen Bereitstellung in Konfigurationen mit Anmeldeknoten geführt hat, indem Sie fehlende Berechtigungen, die für Anmeldeknoten erforderlich sind, in der öffentlichen Richtlinienvorlage hinzufügen. https://github.com/aws/aws-parallelcluster/issues/6483

21. Oktober 2024

AWS ParallelCluster Version 3.11.0 veröffentlicht

Verbesserungen

  • Unterstützung für benutzerdefinierte Aktionen auf Anmeldeknoten hinzugefügt.

  • DCV-Verbindung zu Anmeldeknoten zulassen.

  • Unterstützung für die Region ap-southeast-3 hinzugefügt.

  • Fügen Sie dem Network Load Balancer für den Anmeldeknoten Sicherheitsgruppen hinzu.

  • AllowedIpsKonfiguration für Anmeldeknoten hinzufügen.

  • Fügen Sie eine neue Konfiguration hinzuSharedStorage/EfsSettings/AccessPointId, um einen optionalen EFS-Zugriffspunkt für eine Halterung anzugeben

  • Erlauben Sie bis zu 10 Anmeldeknotenpools.

  • Installieren Sie Enroot und Pyxis im offiziellen Pcluster AMIs

Änderungen

  • [BREAKING] Das von der API DescribeCluster und dem CLI-Befehl zurückgegebene loginNodes Feld describe-cluster wurde von einem Wörterbuch in ein Array geändert, um mehrere Pools von Login-Knoten zu unterstützen. Durch diese Änderung wird die Abwärtskompatibilität beeinträchtigt, sodass diese Operationen nicht mit Clustern kompatibel sind, die mit älteren Versionen bereitgestellt wurden.

  • Führen Sie ein Upgrade von Slurm auf 23.11.10 (von 23.11.7) durch.

  • Aktualisieren Sie Pmix auf 5.0.3 (von 5.0.2).

  • Aktualisieren Sie das EFA-Installationsprogramm auf. 1.34.0

    • EFA-Treiber: efa-2.10.0-1

    • EFA-Konfiguration: efa-config-1.17-1

    • EFA-Profil: efa-profile-1.7-1

    • libFabric-aws: libfabric-aws-1.22.0-1

    • RDMA-Kern: rdma-core-52.0-1

    • MPI öffnen: und openmpi40-aws-4.1.6-3 openmpi50-aws-5.0.3-11

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 550.90.07 (von 535.183.01).

  • Aktualisieren Sie das CUDA Toolkit auf Version 12.4.1 (von 12.2.2).

  • Aktualisieren Sie Python auf 3.9.20 (von 3.9.19).

  • Aktualisieren Sie die Intel MPI Library auf 2021.13.1.769 (von 2021.12.1.8).

Fehlerbehebungen

  • Korrigieren Sie den Validator EfaPlacementGroupValidator so, dass er nicht vorschlägt, eine Platzierungsgruppe zu konfigurieren, wenn Kapazitätsblöcke verwendet werden.

  • Beheben Sie gelegentlich auftretende Fehler bei der Clustererstellung, indem Sie sicherstellen, dass Dateisysteme FSx für Lustre nach den Sicherheitsgruppenregeln erstellt werden.

  • Behebt Fehler beim Löschen von Clustern, wenn die Platzierungsgruppe aktiviert ist.

  • Problem behoben, bei dem Anmeldeknoten bei der Einschränkung des SSH-Zugriffs als fehlerhaft markiert wurden.

  • Problem beheben, retrieve_supported_regions sodass die richtige S3-URL abgerufen werden kann.

  • Korrektur describe_images zur Verwendung von Paginierung.

  • No route tables foundFehler bei der Angabe des Standard-VPC-Subnetzes auf /Networking/ behoben. LoginNodes SubnetIds

26. September 2024

AWS ParallelCluster Version 3.10.1 veröffentlicht

Fehlerbehebungen

  • Behebung eines Fehlers bei der Image-Erstellung in China Regionen.

8. Juli 2024

AWS ParallelCluster Version 3.10.0 veröffentlicht

Verbesserungen:

  • Fügen Sie einen neuen Konfigurationsabschnitt hinzuScheduling/SlurmSettings/ExternalSlurmdbd, um den Cluster mit einer externen Slurmdbd zu verbinden.

  • Erlaubt die Ausführung von Build-Image in einem isolierten Netzwerk.

  • Unterstützung für Amazon Linux 2023 hinzufügen.

  • Unterstützung für price-capacity-optimized als hinzufügenAllocationStrategy.

  • Fügen Sie einen Validator hinzu, um die Verwendung von Platzierungsgruppen mit Kapazitätsblöcken zu verhindern.

Änderungen:

  • CentOS 7 wird nicht mehr unterstützt.

  • Aktualisieren Sie den Cinc Client von 18.2.7 auf Version 18.4.12.

  • Aktualisieren Sie munge auf Version 0.5.16 (von 0.5.15).

  • Aktualisieren Sie Pmix auf 5.0.2 (von 4.2.9).

  • Aktualisieren Sie die Abhängigkeiten von Drittanbieter-Kochbüchern:

    • apt-7.5.22 (von apt-7.5.14)

    • openssh-2.11.12 (von openssh-2.11.3)

  • Entfernen Sie das Kochbuch eines Drittanbieters: selinux-6.1.12.

  • Aktualisieren Sie das 1.32.0 EFA-Installationsprogramm auf.

    • EFA-Treiber: efa-2.8.0-1

    • EFA-Konfiguration: efa-config-1.16-1

    • EFA-Profil: efa-profile-1.7-1

    • libFabric-aws: libfabric-aws-1.21.0-1

    • RDMA-Kern: rdma-core-50.0-1

    • MPI öffnen: und openmpi40-aws-4.1.6-3 openmpi50-aws-5.0.2-12

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 535.183.01 (von 535.154.05).

  • Aktualisieren Sie Python auf 3.9.19 (von 3.9.17).

  • Aktualisieren Sie die Intel MPI Library auf 2021.12.1.8 (von 2021.9.0.43482).

Fehlerbehebungen:

  • Korrigieren Sie die Konfiguration der Datenrepository-Zuordnungen auf „Make-and-Option“ AutoExportPolicy AutoImportPolicy

  • Es wurde ein Problem beim Löschen von Clustern behoben, bei dem die Bereinigung der Rechenflotte jetzt abgeschlossen wurde, wenn Instances entweder heruntergefahren oder beendet wurden. Dadurch sollen Fehler beim Löschen von Clustern bei Instance-Typen mit längeren Kündigungszyklen vermieden werden.

  • Erlauben Sie im Monitoring Abschnitt der Cluster-Konfiguration, dass das Cloudwatch-Dashboard aktiviert und Alarme deaktiviert werden.

  • Erlaube ParallelCluster Custom Resource, Validatoren zu unterdrücken, indem PclusterCluster/SuppressValidators

  • Wird entfernt, /etc/profile.d/pcluster.sh sodass es nicht bei jeder Benutzeranmeldung ausgeführt und nicht zur Umgebungsvariablen PATH hinzugefügt cfn_bootstrap_virtualenv wird.

  • Korrigieren Sie die ParallelCluster API-Spezifikation, indem Sie das Feld failureReason durch failures in DescribeCluster response ersetzen.

  • Korrigieren Sie die ParallelCluster API-Spezifikation, indem Sie die fehlenden CloudFormation Stack-Status hinzufügen:IMPORT_*, undREVIEW_IN_PROGRESS. UPDATE_FAILED

  • Behebt ein Problem, das verhindert hat, dass Cluster-Updates EFS-Dateisysteme mit Verschlüsselung bei der Übertragung enthalten.

  • Behebt ein Problem, das verhinderte, dass die Dienste slurmctld und slurmdbd beim Neustart des Hauptknotens neu gestartet wurden, wenn EFS für gemeinsam genutzte interne Daten verwendet wurde.

  • Entfernen Sie auf Ubuntu-Systemen die Standard-Logrotate-Konfiguration für Cloud-Init-Protokolldateien, die mit der Konfiguration von kollidierten. ParallelCluster

  • Behebung eines Fehlers bei der Image-Erstellung mit RHEL 8.10 oder neuer.

27. Juni 2024

AWS ParallelCluster Version 3.9.3 veröffentlicht

Um ein Upgrade durchzuführen, geben Sie sudo pip install --upgrade aws-parallelcluster

Features:

  • Unterstützung für FSx Lustre AS als gemeinsam genutzten Speichertyp wurde hinzugefügtus-iso-east-1.

Fehlerbehebungen:

  • cloud_dnsAus der SlurmctldParameters Slurm-Konfiguration entfernen, um Probleme mit dem Slurm-Fanout zu vermeiden.

    Dies ist nicht erforderlich, da wir die IP-Adressen beim Start der Instance festlegen.

19. Juni 2024

AWS ParallelCluster Version 3.9.2 veröffentlicht

Features:

  • Upgraden Sie Slurm auf 23.11.7 (von 23.11.4).

  • Weitere Einzelheiten finden Sie unter. CHANGELOG 3.9.2 GitHub

28. Mai 2024

AWS ParallelCluster Version 3.9.1 veröffentlicht

Um ein Upgrade durchzuführen, geben Sie Folgendes ein: sudo pip install --upgrade aws-parallelcluster

Fehlerbehebungen

  • Entfernt das rekursive Löschen des gemeinsam genutzten Speichers mountdir beim Aushängen von Dateisystemen als Teil des Update-Cluster-Vorgangs.

11. April 2024

AWS ParallelCluster Version 3.9.0 veröffentlicht

Um ein Upgrade durchzuführen, geben Sie Folgendes ein: sudo pip install --upgrade aws-parallelcluster

Verbesserungen:

  • Fügen Sie den Konfigurationsparameter DeploymentSettings/DefaultUserHome hinzu, damit Benutzer das Home-Verzeichnis des Standardbenutzers /local/home anstelle von /home (Standard) verschieben können.

  • Ermöglicht die Aktualisierung von Queue und ComputeResource Konfigurationsparametern MinCountMaxCount, ohne dass die Rechenflotte gestoppt werden muss. Es ist jetzt möglich, sie zu aktualisieren, indem Sie sie Scheduling/SlurmSettings/QueueUpdateStrategy auf TERMINATE setzen. AWS ParallelCluster beendet nur die Knoten, die bei einer Größenänderung der Clusterkapazität durch ein Cluster-Update entfernt wurden.

  • Erlaubt die Aktualisierung des externen gemeinsam genutzten Speichers vom Typ Efs,, FsxLustre,, FsxOntap, FileCache ohne die Rechen FsxOpenZfs - und Anmeldeflotte zu ersetzen.

  • Unterstützung hinzufügen für RHEL9.

  • Unterstützung für Rocky Linux 9 hinzugefügt, wie es durch den build-image Prozess CustomAmi erstellt wurde. Derzeit ist kein offizielles AWS ParallelCluster Rocky9 Linux AMI verfügbar.

  • CommunicationParametersAus der Ablehnungsliste für benutzerdefinierte Slurm-Einstellungen entfernen.

  • Fügen Sie einen DeploymentSettings/DisableSudoAccessForDefaultUser Parameter hinzu, um den Sudo-Zugriff des Standardbenutzers zu deaktivieren, wenn er unterstützt wird. OSes

  • Änderungen an FSx für Lustre-Dateisysteme erstellt von ParallelCluster: Ändern Sie die Lustre-Serverversion in 2.15.

  • Fügen Sie die Möglichkeit hinzu, beim Erstellen eines AMI über das ['cluster']['nvidia']['kernel_open'] Cookbook-Knotenattribut zwischen Open- und Closed Source-Nvidia-Treibern zu wählen.

  • * Fügen Sie eine clustermgtd-Konfigurationsoption hinzu, um eine konfigurierbare Anzahl von Wiederholungsversuchen ec2_instance_missing_max_count zu ermöglichen, damit Amazon EC2 Describe Instances letztendlich mit ausgeführten Instances konsistent ist.

Änderungen

  • Führen Sie ein Upgrade von Slurm auf 23.11.4 (von 23.02.7) durch.

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 535.154.05.

  • Unterstützung für Python 3.11, 3.12 in pcluster CLI hinzugefügt und. aws-parallelcluster-batch-cli

  • Erstellen Sie Netzwerkschnittstellen mithilfe des Netzwerkkartenindexes aus der NetworkCardIndex Liste der EC2 DescribeInstances Amazon-Antworten, anstatt sich über die MaximumNetworkCards Reichweite zu schleifen.

  • Schlägt die Clustererstellung fehl, wenn Sie die Instance-Typen P3, G3, P2 und G2 verwenden, da deren GPU-Architektur nicht mit den in Version 3.8.0 eingeführten Open-Source-Nvidia-Treibern (OpenRM) kompatibel ist.

  • Aktualisieren Sie die Abhängigkeiten von Drittanbieter-Kochbüchern: nfs-5.1.2 (von nfs-5.0.0)

  • Aktualisieren Sie das EFA-Installationsprogramm auf 1.30.0.

    • EFA-Treiber: efa-2.6.0-1

    • EFA-Konfiguration: efa-config-1.15-1

    • EFA-Profil: efa-profile-1.6-1

    • libFabric-aws: libfabric-aws-1.19.0

    • RDMA-Kern: rdma-core-46.0-1

    • MPI öffnen: und openmpi40-aws-4.1.6-2 openmpi50-aws-5.0.0-11

  • NICE DCV auf Version aktualisieren 2023.1-16388.

    • Server: 2023.1.16388-1

    • xdcv: 2023.1.565-1

    • gl: 2023.1.1047-1

    • Webviewer: 2023.1.16388-1

Fehlerbehebungen

  • Behebung eines Problems, das dazu führte, dass der Job fehlschlug, wenn er als Active Directory-Benutzer von Anmeldeknoten aus eingereicht wurde. Das Problem wurde durch eine unvollständige Konfiguration der Integration mit dem externen Active Directory auf dem Hauptknoten verursacht.

  • Refaktorieren Sie die in der CloudFormation Vorlage parallelclutser-policies.yaml definierten IAM-Richtlinien, um zu verhindern, dass API-Bereitstellungsfehler aufgrund von Richtlinien, die die IAM-Grenzwerte überschreiten, verursacht werden. ParallelCluster

  • Behebung eines Problems, das dazu führte, dass Anmeldeknoten nicht starteten, wenn der Hauptknoten mehr Zeit als erwartet für das Schreiben von Schlüsseln benötigt.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-uiPaket unter GitHub.

5. März 2024

AWS ParallelCluster Version 3.8.0 veröffentlicht

AWS ParallelCluster Version 3.8.0 veröffentlicht.

Verbesserungen:

  • Unterstützung für Amazon EC2 Capacity Blocks for ML hinzugefügt.

  • Fügen Sie Unterstützung für Rocky Linux 8 hinzu, wie es durch den build-image Prozess CustomAmi erstellt wurde. Derzeit ist kein offizielles AWS ParallelCluster Rocky8 Linux AMI verfügbar.

  • Fügen Sie einen Scheduling/ScalingStrategy Parameter hinzu, um die Cluster-Skalierungsstrategie zu steuern, die beim Starten von EC2 Amazon-Instances für Slurm-Rechenknoten verwendet werden soll. Mögliche Werte sindall-or-nothing,,, greedy-all-or-nothingbest-effort, all-or-nothing wobei es sich um die Standardwerte handelt.

  • Fügen Sie einen HeadNode/SharedStorageType Parameter hinzu, um EFS-Speicher anstelle von NFS-Exporten aus dem Stammvolume des Hauptknotens für gemeinsam genutzte Dateisystemressourcen innerhalb des Clusters zu verwenden: ParallelCluster, Intel, Slurm und Daten. /home Diese Erweiterung reduziert die Belastung des Headnode-Netzwerks.

  • Ermöglicht das /home Mounten als EFS oder FSx externen gemeinsam genutzten Speicher über den SharedStorage Abschnitt der Konfigurationsdatei.

  • Fügen Sie einen neuen Parameter hinzuSlurmSettings/MungeKeySecretArn, um die Verwendung eines externen benutzerdefinierten MUNGE-Schlüssels aus AWS Secrets Manager zu ermöglichen.

  • Fügen Sie einen Monitoring/Alarms/Enabled Parameter hinzu, um Amazon CloudWatch Alarms für den Cluster umzuschalten.

  • Fügen Sie Head-Node-Alarme hinzu, um die EC2 Amazon-Integritätsprüfungen, die CPU-Auslastung und den Gesamtstatus des Head-Knotens zu überwachen, und fügen Sie sie dem CloudWatch Dashboard hinzu, das mit dem Cluster erstellt wurde.

  • Fügen Sie Unterstützung für Datenrepository-Verknüpfungen hinzu, wenn Sie es PERSISTENT_2 als DeploymentType Managed FSx for Lustre verwenden.

  • Fügen Sie einen Scheduling/SlurmSettings/Database/DatabaseName Parameter hinzu, mit dem Benutzer einen benutzerdefinierten Namen für die Datenbank auf dem Datenbankserver angeben können, der für die Slurm-Buchhaltung verwendet werden soll.

  • Geben Sie InstanceType bei der Konfiguration CapacityReservationTarget/CapacityReservationId in der Rechenressource einen optionalen Konfigurationsparameter an.

  • Fügen Sie die Möglichkeit hinzu, ein Präfix für IAM-Rollen und -Richtlinien anzugeben, die von der AWS ParallelCluster API erstellt wurden.

  • Fügt die Möglichkeit hinzu, eine Berechtigungsgrenze anzugeben, die für von AWS ParallelCluster der API erstellte IAM-Rollen und -Richtlinien angewendet werden soll.

Änderungen

  • Aktualisieren Sie Slurm auf 23.02.7 (von 23.02.6).

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 535.129.03.

  • Aktualisieren Sie das CUDA Toolkit auf Version 12.2.2.

  • Verwenden Sie Open-Source-NVIDIA-GPU-Treiber (OpenRM) als NVIDIA-Kernelmodul für Linux anstelle des NVIDIA-ClosedSource-Moduls.

  • Entfernen Sie die Unterstützung der all_or_nothing_batch Konfigurationsparameter im Slurm-Resume-Programm zugunsten der neuen Scheduling/ScalingStrategy Cluster-Konfiguration.

  • Die Benennungskonvention für Cluster-Alarme wurde in '[Clustername] - [Komponentenname] - [Metrik]' geändert.

  • Ändern Sie die standardmäßigen EBS-Volumetypen in ADC-Regionen von gp2 auf gp3, sowohl für das Stammvolume als auch für zusätzliche Volumes.

  • Die optionale Berechtigungsgrenze für die AWS ParallelCluster API wird jetzt auf jede IAM-Rolle angewendet, die von der API-Infrastruktur erstellt wurde.

    • Aktualisieren Sie das EFA-Installationsprogramm auf. 1.29.1

    • EFA-Treiber: efa-2.6.0-1

    • EFA-Konfiguration: efa-config-1.15-1

    • EFA-Profil: efa-profile-1.5-1

    • libFabric-aws: libfabric-aws-1.19.0-1

    • RDMA-Kern: rdma-core-46.0-1

    • MPI öffnen: openmpi40-aws-4.1.6-1

  • Führen GDRCopy Sie für alle unterstützten Versionen ein Upgrade auf Version 2.4 durch OSes, mit Ausnahme von Centos 7, wo Version 2.3.1 verwendet wird.

  • Führen Sie ein Upgrade aws-cfn-bootstrap auf Version 2.0-28 durch.

  • Unterstützung für Python 3.10 in aws-parallelcluster-batch-cli hinzugefügt.

Fehlerbehebungen

  • Korrigiert die inkonsistente Skalierungskonfiguration nach dem Rollback des Cluster-Updates, wenn die Liste der in den Compute-Ressourcen deklarierten Instanztypen geändert wurde.

  • Behebung der Generierung von SSH-Schlüsseln für Benutzer beim Wechseln von Benutzern ohne Root-Rechte in Clustern, die über Cluster-Konfigurationsdateien in einen externen LDAP-Server integriert sind.

  • Das Deaktivieren des Slurm-Stromsparmodus bei der Einstellung wurde behoben. ScaledownIdletime = -1

  • Korrigiert den fest codierten Pfad zum Slurm-Installationsverzeichnis im update_slurm_database_password.sh Skript für Slurm Accounting.

19. Dezember 2023

AWS ParallelCluster Version 3.7.2 veröffentlicht

AWS ParallelCluster Version 3.7.2 veröffentlicht.

Änderungen:

  • Aktualisiere Slurm auf 23.02.6.

25. Oktober 2023

AWS ParallelCluster Version 3.7.1 veröffentlicht

AWS ParallelCluster Version 3.7.1 veröffentlicht.

Änderungen:

  • Upgraden Sie Slurm auf 23.02.5 (von 23.02.4).

    • Aktualisieren Sie Pmix auf 4.2.6 (von 3.2.3).

    • Aktualisieren Sie libjwt auf 1.15.3 (von 1.12.0).

  • Aktualisieren Sie das EFA-Installationsprogramm auf und beheben Sie damit das RDMA-WriteData-Problem in 1.26.1 P5.

    • efa-2.5.0-1EFA-Treiber:.

    • EFA-Konfiguration:. efa-config-1.15-1

    • EFA-Profil:. efa-profile-1.5-1

    • libFabric-aws:. libfabric-aws-1.18.2-1

    • ERdma-Kern:. rdma-core-46.0-1

    • Öffnen Sie MPI:. openmpi40-aws-4.1.5-4

22. September 2023

AWS ParallelCluster Version 3.7.0 veröffentlicht

AWS ParallelCluster Version 3.7.0 veröffentlicht.

Verbesserungen:

  • Support die Konfiguration statischer und dynamischer Knotenprioritäten in Rechenressourcen mithilfe einer AWS ParallelCluster YAML-Konfigurationsdatei.

  • Unterstützung für Ubuntu 22 hinzufügen. RSA-Schlüssel werden standardmäßig nicht unterstützt.

  • Fügen Sie die Einstellung für die Warteschlangenkonfiguration hinzuJobExclusiveAllocation, um Knoten in einer Partition zu einem bestimmten Zeitpunkt ausschließlich einem einzelnen Job zuzuweisen.

  • Lassen Sie aws-parallelcluster-node das Override-Paket bei der Clustererstellung und beim Cluster-Update zu. Für den Hauptknoten gilt dies für das Cluster-Update. Nur für Entwicklungszwecke nützlich.

  • Vermeiden Sie den Start von NFS-Servern auf Rechenknoten.

  • Unterstützung für Anmeldeknoten hinzufügen.

  • Erlaubt die speicherbasierte Planung, wenn mehrere Instanztypen für eine Slurm-Rechenressource angegeben sind.

  • Unterstützung hinzugefügt, um vorhandenen Amazon File Cache als gemeinsam genutzten Speicher bereitzustellen.

Änderungen:

  • Weisen Sie dynamischen Slurm-Knoten standardmäßig eine Priorität (Gewichtung) von 1000 zu. Auf diese Weise kann Slurm inaktive statische Knoten gegenüber inaktiven dynamischen Knoten priorisieren.

  • Sorgen Sie dafür, dass aws-parallelcluster-node Daemons nur verwaltete Slurm-Partitionen verwalten AWS ParallelCluster .

  • Erhöhen Sie das EFS-utils Watchdog-Abfrageintervall auf 10 Sekunden. Diese Änderung gilttrue, wenn sie auf gesetzt EncryptionInTransit ist. Dies ist die einzige Bedingung, unter der der Watchdog ausgeführt wird.

  • Aktualisieren Sie das EFA-Installationsprogramm auf. 1.25.1

    • EFA-Treiber: efa-2.5.0-1 (von) efa-2.1.1g

    • EFA-Config: (von) efa-config-1.15-1 efa-config-1.13-1

    • EFA-Profil: efa-profile-1.5-1 (keine Änderung)

    • libFabric-aws: (von) libfabric-aws-1.18.1-0 libfabric-aws-1.17.1-1

    • RDMA-Core: (von) rdma-core-46.0-1 rdma-core-43.0-1

    • MPI öffnen: openmpi40-aws-4.1.5-4 (von) openmpi40-aws-4.1.5-1

  • Aktualisieren Sie Slurm auf Version 23.02.4.

  • Ändern Sie den Standardwert Imds/ImdsSupport von v1.0 auf v2.0.

  • Verwerfen Sie Ubuntu 18.

  • Aktualisieren Sie die Standardgröße des Root-Volumes auf 40 GB, um die Beschränkungen auf Centos 7 zu berücksichtigen.

  • Beschränken Sie die Zugriffsrechte für die Datei /tmp/wait_condition_handle.txt innerhalb des Hauptknotens, sodass nur Root-Benutzer sie lesen können.

  • Erstellen Sie eine JSON-Datei mit einer Slurm-Partition-Nodelist-Zuordnung, die von den Node-Paket-Daemons verwendet werden soll, um vom PC verwaltete Slurm-Partitionen und -Knotenlisten zu erkennen.

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 535.54.03.

  • Aktualisieren Sie die CUDA-Bibliothek auf Version 12.2.0.

  • Aktualisieren Sie den NVIDIA Fabric Manager auf nvidia-fabricmanager-535.

  • Aktualisieren Sie ARM PL auf Version 23.04.1 nur für Ubuntu 22.04.

  • Aktualisieren Sie NICE DCV auf Version2023.0-15487.

    • Server: 2023.0.15487-1

    • xdcv: 2023.0.551-1

    • gl: 2023.0.1039-1

    • Webviewer: 2023.0.15487-1

Fehlerbehebungen:

  • Fügen Sie dem ScaledownIdletime Wert eine Validierung hinzu, um zu verhindern, dass ein Wert niedriger als -1 gesetzt wird.

  • Behebung eines Fehlers bei der Clustererstellung mit Ubuntu Deep Learning AMI auf GPU-Instanzen mit aktiviertem DCV.

  • Problem behoben, das dazu führte, dass beim Erstellen eines ParallelCluster CloudFormation benutzerdefinierten Ressourcenanbieters mit fehlerhafte IAM-Richtlinien erstellt wurden. CustomLambdaRole

  • Behebt ein Problem, das zu einer falschen Ausrichtung des DNS-Namens von Rechenknoten auf Instances mit mehreren Netzwerkschnittstellen führte, wenn Equals to verwendet wurde SlurmSettings/Dns/UseEc2Hostnames True

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für aws-parallelcluster, und packages on. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

30. August 2023

Veröffentlichung nur zur Dokumentation

AWS ParallelCluster Spezifisches Benutzerhandbuch für Version 3 veröffentlicht.

Version nur zur Dokumentation:

  • AWS ParallelCluster Version 3 hat ein eigenes separates Benutzerhandbuch.

17. Juli 2023

AWS ParallelCluster Version 3.6.1 veröffentlicht

AWS ParallelCluster Version 3.6.1 veröffentlicht.

Änderungen:

  • Vermeiden Sie die doppelte Anzahl von Knoten, clustermgtd wenn Rechenknoten zu mehreren Slurm-Partitionen hinzugefügt werden.

Fehlerbehebungen:

  • Entfernen Sie die feste Kodierung des Gerätenamens (/dev/sda1und/dev/xvda) auf dem Root-Volume und rufen Sie ihn aus dem AMIs verwendeten Ordner ab. create-cluster

  • Behebung eines Fehlers bei der Clustererstellung bei Verwendung einer CloudFormation benutzerdefinierten Ressource mit ElasticIp Einstellung aufTrue.

  • Behebt Fehler beim Erstellen und Aktualisieren von Clustern, wenn eine AWS CloudFormation benutzerdefinierte Ressource mit großen Konfigurationsdateien verwendet wurde.

  • Behebt ein Problem, durch das der ptrace Schutz auf Ubuntu nicht deaktiviert werden konnte und das Cross Memory Attach (CMA) in libfabric nicht zuließ.

  • Behebt die schnelle Failover-Logik mit unzureichender Kapazität, wenn mehrere Instanztypen verwendet werden und keine Instanzen zurückgegeben werden.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

5. Juli 2023

AWS ParallelCluster Version 3.6.0 veröffentlicht

AWS ParallelCluster Version 3.6.0 veröffentlicht.

Dokumentation:

Verbesserungen:

  • Unterstützung hinzufügen für RHEL8.

  • Fügen Sie eine AWS CloudFormation benutzerdefinierte Ressource zum Erstellen und Verwalten von Clustern mit hinzu CloudFormation.

  • Unterstützung für die Anpassung der Cluster-Slurm-Konfiguration in der AWS ParallelCluster YAML-Konfigurationsdatei hinzufügen.

  • Erstellen Sie Slurm mit Unterstützung für LUA.

  • Erhöhen Sie das Limit für die maximale Anzahl von Warteschlangen pro Cluster von 10 auf 50. Jede Warteschlange kann bis zu 50 Rechenressourcen enthalten. Jeder Cluster kann bis zu 50 Rechenressourcen haben.

  • Fügen Sie Unterstützung für die Angabe einer Sequenz von mehreren benutzerdefinierten Aktionsskripten für ein Ereignis hinzu, das in den OnNodeUpdated Parametern OnNodeStartOnNodeConfigured, und konfiguriert ist.

  • Fügen Sie den neuen KonfigurationsabschnittHealthChecks/hinzuGpu, um GPU-Zustandsprüfungen auf einen Rechenknoten anzuwenden, bevor ein Job ausgeführt wird.

  • Fügen Sie Unterstützung für Tags in der ComputeResources Konfiguration SlurmQueues undSlurmQueues/hinzu.

  • Fügen Sie DetailedMonitoringin der Monitoring Konfiguration Unterstützung für hinzu.

  • Fügen Sie mem_used_percent im AWS ParallelCluster CloudWatch Dashboard disk_used_percent Metriken für den Arbeitsspeicher und die Festplattenauslastung des Hauptknotens hinzu und richten Sie Alarme zur Überwachung dieser Messwerte ein.

  • Fügen Sie Unterstützung für die Protokollrotation für AWS ParallelCluster verwaltete Protokolle hinzu.

  • Verfolgen Sie häufige Rechenknotenfehler und die längste Leerlaufzeit dynamischer Knoten im CloudWatch Dashboard.

  • Erzwingen Sie, dass der DCV Authenticator Server bei der Erstellung des SSL-Sockets mindestens TLS-1.2 das Protokoll verwendet.

  • Installieren Sie das NVIDIA Data Center GPU Manager (DCGM) -Paket auf allen unterstützten Betriebssystemen außer und. aarch64 centos7 alinux2

  • Laden Sie standardmäßig das Kernelmodul nvidia-uvm, um dem CUDA-Treiber Unified Virtual Memory (UVM) -Funktionalität zur Verfügung zu stellen.

  • Installieren Sie den NVIDIA Persistence Daemon als Systemdienst.

Änderungen:

  • Aktualisieren Sie Slurm auf Version 23.02.2 (von Version22.05.8).

  • Aktualisieren Sie munge auf Version 0.5.15 (von Version0.5.14).

  • Setze den Slurm TreeWidth auf 30.

  • Stellen Sie den Slurm prolog und die epilog Konfigurationen auf das Zielverzeichnis /opt/slurm/etc/scripts/prolog.d/ bzw. /opt/slurm/etc/scripts/epilog.d/

  • Stellen Sie Slurm BatchStartTimeout auf maximal 3 Minuten für die Ausführung von Prolog Skripten während der Registrierung des Rechenknotens ein.

  • Erhöhen Sie die Standardeinstellung RetentionInDays für CloudWatch Logs von 14 auf 180 Tage.

  • Aktualisieren Sie das EFA-Installationsprogramm auf1.22.1.

    • Dkms: 2.8.3-2

    • EFA-Treiber: efa-2.1.1g (keine Änderung)

    • EFA-Config: efa-config-1.13-1 (keine Änderung)

    • EFA-Profil: efa-profile-1.5-1 (keine Änderung)

    • libFabric-aws: (von) libfabric-aws-1.17.1-1 libfabric-aws-1.17.0-1

    • RDMA-Core: (keine Änderung) rdma-core-43.0-1

    • MPI öffnen: openmpi40-aws-4.1.5-1 (keine Änderung)

  • Führen Sie ein Upgrade der Lustre-Client-Version 2.12 auf Amazon Linux 2 durch. Der Lustre-Client 2.12 wurde auf Ubuntu 20.04, 18.04 und CentOS >= 7.7 installiert.

  • Aktualisieren Sie die Lustre-Client-Version 2.10.8 auf CentOS 7.6.

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 470.182.03 (von Version470.141.03).

  • Aktualisieren Sie den NVIDIA Fabric Manager auf Version 470.182.03 (von Version470.141.03).

  • Aktualisieren Sie das NVIDIA CUDA Toolkit auf Version 11.8.0 (von Version11.7.1).

  • Aktualisieren Sie das NVIDIA CUDA-Beispiel auf Version. 11.8.0

  • Aktualisieren Sie die Intel MPI-Bibliothek auf Version 2021 Update 9 (von Version 2021 Update 6). Weitere Informationen finden Sie unter Intel® MPI Library 2021 Update 9.

  • Aktualisieren Sie NICE DCV auf Version 2023.0-15022 (von Version2022.2-14521).

    • Server: 2023.0.15022-1 (von Version2022.2-14521-1).

    • xdcv: 2023.0.547-1 (aus Version2022.2.519-1).

    • gl: 2023.0.1027-1 (aus Version2022.2.1012-1).

    • web_viewer: 2023.0.15022-1 (aus Version2022.2.14521-1).

  • Auf Version aktualisierenaws-cfn-bootstrap. 2.0-24

  • Upgrade-Image, das von der CodeBuild Umgebung beim Erstellen von Container-Images für AWS Batch-Cluster verwendet wird:

    • aws/codebuild/amazonlinux2-x86_64-standard:4.0(vonaws/codebuild/amazonlinux2-x86_64-standard:3.0).

    • aws/codebuild/amazonlinux2-aarch64-standard:2.0(vonaws/codebuild/amazonlinux2-aarch64-standard:1.0).

Fehlerbehebungen:

  • Korrigieren Sie Amazon EFS und Amazon FSx Network Security Group Validators, um zu vermeiden, dass falsche Fehler gemeldet werden.

  • Korrigiert das fehlende Tagging von Ressourcen, die von Image Builder während des build-image Vorgangs erstellt wurden.

  • Korrigieren Sie die AktualisierungsrichtlinieMaxCount, um immer numerische Vergleiche für die MaxCount Immobilie durchzuführen.

  • Korrigieren Sie die IP-Ausrichtung auf Rechenknoteninstanzen mit mehreren Netzwerkkarten.

  • Korrigiert die Ersetzung von StoragePass in derslurm_parallelcluster_slurmdbd.conf, wenn eine Aktualisierung der Warteschlangenparameter durchgeführt wird und die Slurm-Accounting-Konfigurationen nicht aktualisiert werden.

  • Behebt ein Problem, das dazu führt, dass beim Erstellen eines Clusters mit einem vorhandenen EFS-Dateisystem fehlerhafte Sicherheitsgruppen erstellt werden.

  • Behebt das Problem, dass der cfn-hup Daemon beim Neustart fehlschlägt.

  • Betrachten Sie dynamische Knoten, die als Bootstrap-Fehler gekennzeichnet sind, für den Slurm-geschützten Modus. INVALID_REG Statische Knoten, bei denen die Slurm-Registrierung fehlschlägt, werden nach dem bereits als Bootstrap-Fehler behandelt. node_replacement_timeout

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

22. Mai 2023

AWS ParallelCluster Version 3.5.1 veröffentlicht

AWS ParallelCluster Version 3.5.1 veröffentlicht.

Verbesserungen:

Änderungen:

  • Aktualisieren Sie das EFA-Installationsprogramm auf1.22.0.

    • EFA-Treiber: efa-2.1.1g (von) efa-2.1.1-1

    • EFA-Config: (aus efa-config-1.12-1efa-config-1.13-1)

    • efa-profile-1.5-1EFA-Profil: (keine Änderung)

    • libFabric-aws: (von) libfabric-aws-1.17.0-1 libfabric-aws-1.16.1amzn3.0-1

    • RDMA-Core: (keine Änderung) rdma-core-43.0-1

    • MPI öffnen: openmpi40-aws-4.1.5-1 (von) openmpi40-aws-4.1.4-3

    Aktualisieren Sie NICE DCV auf Version2022.2-14521.

    • Server: 2022.2.14521-1

    • xdcv: 2022.2.519-1

    • gl: 2022.2.1012-1

    • Webviewer: 2022.2.14521-1

Fehlerbehebungen:

  • Beheben Sie potenzielle Fehler beim Starten von Knoten, die durch Musterabgleiche zwischen MountDir und /etc/exports beim Entfernen gemeinsam genutzter Amazon EBS-Volumes im Rahmen eines Cluster-Updates verursacht wurden.

  • Korrektur, um zu verhindern, dass compute_console_output Protokolldateien bei jeder clustermgtd Iteration gekürzt werden.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für aws-parallelcluster, und packages on. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

29. März 2023

AWS ParallelCluster Version 3.5.0 veröffentlicht

AWS ParallelCluster Version 3.5.0 veröffentlicht.

Verbesserungen:

  • Greifen Sie über die AWS ParallelCluster Benutzeroberfläche auf Cluster zu und verwalten Sie sie.

  • Fügen Sie versionierte AWS ParallelCluster Richtlinien zu einer CloudFormation Vorlage hinzu, auf die Sie in Ihren Workloads verweisen können.

  • Fügen Sie eine AWS ParallelCluster Python-Bibliothek hinzu, die Sie mit Ihrem eigenen Code verwenden können.

  • Fügen Sie Amazon die Protokollierung der Ausgabe der Compute-Knoten-Konsole bei CloudWatch einem Bootstrap-Fehler des Compute-Knotens hinzu.

  • Fügen Sie ein Feld für Fehler hinzu, das den Fehlercode und den Grund für die describe-cluster Ausgabe enthält, wenn die Clustererstellung fehlschlägt.

  • Fügen Sie Validatoren hinzu, um die böswillige Eingabe von Zeichenketten beim Aufrufen des Unterprozessmoduls zu verhindern.

  • Schlägt die Clustererstellung fehl, wenn sich der Clusterstatus PROTECTED während der Bereitstellung statischer Knoten auf ändert.

Änderungen:

  • Upgrade auf Slurm-Version 22.05.8 (von Version22.05.7)

  • Aktualisieren Sie das EFA-Installationsprogramm auf. 1.21.0

    • EFA-Treiber: efa-2.1.1-1 (von) efa-2.1

    • EFA-Config: (aus efa-config-1.11-1efa-config-1.12-1)

    • efa-profile-1.5-1EFA-Profil: (keine Änderung)

    • libFabric-aws: (von) libfabric-aws-1.16.1amzn3.0-1 libfabric-aws-1.16.1

    • RDMA-Core: (von) rdma-core-43.0-1 rdma-core-43.0-2

    • MPI öffnen: openmpi40-aws-4.1.4-3 (keine Änderung)

  • Machen Sie die Slurm-Controller-Logs ausführlicher und aktivieren Sie zusätzliche Protokollierung für das Slurm-Energiespar-Plugin.

Fehlerbehebungen:

  • Korrigieren Sie die Erstellung von Cluster-Datenbanken, indem Sie sicherstellen, dass der Clustername nicht länger als 40 Zeichen ist, wenn die Slurm-Accounting-Funktion aktiviert ist.

  • Behebung eines Problems, das dazu führteclustermgtd, dass Rechenknoten, die über Slurm neu gestartet wurden, ersetzt wurden, wenn die Statusprüfungen der EC2 Amazon-Instance fehlschlagen.

  • Behebung eines Problems, das aufgrund einer falschen IAM-Richtlinie auf dem Hauptknoten verhinderte, dass Rechenknoten, deren Kapazitätsreservierungen von anderen Konten gemeinsam genutzt wurden, gestartet werden konnten.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für aws-parallelcluster, aws-parallelcluster-cookbook, aws-parallelcluster-nodeund packages auf. aws-parallelcluster-ui GitHub

20. Februar 2023

AWS ParallelCluster Version 3.4.1 veröffentlicht

AWS ParallelCluster Version 3.4.1 veröffentlicht.

Fehlerbehebungen:

  • Behebt ein Problem mit dem Slurm-Scheduler, das zur falschen Anwendung von Updates in der internen Registrierung der Rechenknoten führen konnte. Dieses Problem könnte dazu führen, dass EC2 Instanzen nicht mehr verfügbar sind oder von einem falschen Instanztyp unterstützt werden.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen aws-parallelcluster-cookbookunter. aws-parallelcluster-node GitHub

13. Januar 2023

AWS ParallelCluster Version 3.4.0 veröffentlicht

AWS ParallelCluster Version 3.4.0 veröffentlicht.

Verbesserungen:

  • Fügen Sie Unterstützung für das Starten von Knoten in mehreren Verfügbarkeitszonen hinzu, um die Kapazitätsverfügbarkeit zu erhöhen.

  • Fügen Sie Unterstützung für die Angabe mehrerer Subnetze für jede Warteschlange hinzu, um die Kapazitätsverfügbarkeit zu erhöhen.

  • Fügen Sie einen neuen Konfigurationsparameter in Iam/hinzu ResourcePrefix, um ein Präfix für den Pfad und den Namen der IAM-Ressourcen anzugeben, die von erstellt wurden. AWS ParallelCluster

  • Fügen Sie den neuen Konfigurationsabschnitt DeploymentSettings/hinzu, LambdaFunctionsVpcConfigum die von AWS ParallelCluster Lambda-Funktionen verwendete VPC-Konfiguration anzugeben.

  • Fügen Sie die Möglichkeit hinzu, ein benutzerdefiniertes Skript anzugeben, das während eines Cluster-Updates im Hauptknoten ausgeführt werden soll. Das Skript kann mit HeadNode/CustomActions/angegeben werden, OnNodeUpdatedwenn Slurm als Scheduler verwendet wird.

Änderungen:

  • Entfernen Sie die Erstellung von Amazon EFS-Mount-Zielen für bestehende Dateisysteme.

  • Mounten Sie EFS-Dateisysteme mitamazon-efs-utils. EFS-Dateisysteme können mithilfe von Übertragungsverschlüsselung und einem autorisierten IAM-Benutzer bereitgestellt werden.

  • Installieren Sie stunnel 5.67 auf Cent OS7 und Ubuntu, um die EFS-Verschlüsselung bei der Übertragung zu unterstützen.

  • Aktualisieren Sie das EFA-Installationsprogramm auf 1.20.0 (von). 1.18.0

    • EFA-Treiber: efa-2.1 (von) efa-1.16.0-1

    • EFA-Config: efa-config-1.11-1 (keine Änderung)

    • EFA-Profil: efa-profile-1.5-1 (keine Änderung)

    • libFabric-aws: (von) libfabric-aws-1.16.1 libfabric-aws-1.16.0~amzn4.0-1

    • RDMA-Kern: von () rdma-core-43.0-2 rdma-core-41.0-2

    • Öffne MPI: openmpi40-aws-4.1.4-3 von () openmpi40-aws-4.1.4-2

  • Führen Sie ein Upgrade von Slurm auf Version 22.05.7 (von) durch22.05.5.

  • Führen Sie ein Upgrade von Python auf 3.9.16 und durch3.7.16. (von 3.9.15 und3.7.13).

  • Mit Slurm 22.05.7 werden dynamische Knoten im IDLE+CLOUD+COMPLETING+POWER_DOWN+NOT_RESPONDING Status nicht als fehlerhaft angesehen.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

22. Dezember 2022

AWS ParallelCluster Version 3.3.1 veröffentlicht

AWS ParallelCluster Version 3.3.1 veröffentlicht.

Änderungen:

  • Offizielle AWS ParallelCluster Produkte AMIs sind jetzt verfügbar, nachdem Amazon EC2 nach zwei Jahren eingestellt wurde.

  • Erhöhen Sie die Speichergröße der AWS ParallelCluster API Lambda auf 2048, um Kaltstart-Strafen zu reduzieren und Timeouts zu vermeiden.

Fehlerbehebungen:

  • Vermeiden Sie die Ersetzung von FSx für Lustre verwalteten Dateisystemen und den Verlust von Daten bei Cluster-Updates, die Änderungen an der Subnetz-ID der Rechenflotte beinhalten.

  • SharedStorageDeletionPolicygilt für Cluster-Aktualisierungsaktionen.

Einzelheiten zu den Änderungen finden Sie in der CHANGELOG Datei für das aws-parallelcluster-Paket unter. GitHub

2. Dezember 2022

AWS ParallelCluster nur Dokumentation, hpc6id, Hinweis

AWS ParallelCluster Update nur zur Dokumentation

  • AWS ParallelCluster unterstützt den Instanztyp hpc6id für die Einstellung/nicht. HeadNodeInstanceType

2. Dezember 2022

AWS ParallelCluster Version 3.1.5 veröffentlicht

AWS ParallelCluster Version 3.1.5 veröffentlicht.

Verbesserungen:

  • Behebt das Slurm-Problem, das die Kündigung inaktiver Knoten verhindert.

  • Aktualisieren Sie das EFA-Installationsprogramm auf 1.18.0

    • EFA-Treiber: efa-1.16.0-1

    • EFA-Config: (von) efa-config-1.11-1 efa-config-1.9-1

    • EFA-Profil: efa-profile-1.5-1 (keine Änderung)

    • libFabric-aws: (von). libfabric-aws-1.16.0~amzn4.0-1 libfabric-1.13.2

    • RDMA-Core: (von) rdma-core-41.0-2 rdma-core-37.0

    • MPI öffnen: openmpi40-aws-4.1.4-2 (von) openmpi40-aws-4.1.1-2

Änderungen:

  • lambda:ListTagsFügt und lambda:UntagResource zu dem von der AWS ParallelCluster API ParallelClusterUserRole verwendeten Stack für ein Cluster-Update hinzu.

  • Aktualisieren Sie die Intel MPI Library auf Version 2021 Update 6 (von Version 2021 Update 4). Weitere Informationen finden Sie unter Intel® MPI Library 2021 Update 6.

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 470.141.03 (von 470.103.01).

  • Aktualisieren Sie NVIDIA Fabric Manager auf Version 470.141.03 (von 470.103.01).

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

16. November 2022

AWS ParallelCluster Version 3.3.0 veröffentlicht

AWS ParallelCluster Version 3.3.0 veröffentlicht.

Verbesserungen:

  • Unterstützung für die Konfiguration der Zuweisung mehrerer Instanzen für eine Rechenressource hinzugefügt, wenn Slurm als Scheduler verwendet wird. Weitere Informationen finden Sie unter Zuweisung mehrerer Instanztypen mit Slurm.

  • Fügen Sie Unterstützung für das Hinzufügen und Entfernen SharedStoragemit einem Cluster-Update unter Verwendung einer aktualisierten Konfiguration hinzu. Weitere Informationen finden Sie unter Gemeinsamer Speicher.

  • Fügen Sie neue Konfigurationsparameter DeletionPolicy für Efs und FsxLustregemeinsame Speichereinstellungen hinzu, um die Aufbewahrung von Speicherplatz zu unterstützen.

  • Unterstützung für Slurm-Accounting mit dem neuen Konfigurationsparameter Scheduling SlurmSettings//Database hinzugefügt. Weitere Informationen finden Sie unter Slurm-Buchhaltung mit. AWS ParallelCluster

  • Fügen Sie Unterstützung für On-Demand-Kapazitätsreservierungen (ODCR) und Ressourcengruppen für Kapazitätsreservierungen hinzu. Weitere Informationen finden Sie unter Starten von Instances mit On-Demand-Kapazitätsreservierungen (ODCR).

  • Fügen Sie einen neuen Konfigurationsparameter hinzu, um die IMDS-Version anzugeben, die in einem Cluster unterstützt werden soll, oder erstellen Sie eine Image-Infrastruktur im Cluster, die Konfigurationen Imds/ImdsSupportund Build, Imds/. ImdsSupport

  • Fügen Sie Unterstützung für Networking/PlacementGroupim Abschnitt/hinzu. SlurmQueuesComputeResources

  • Fügen Sie Unterstützung für Instances mit mehreren Netzwerkschnittstellen hinzu, die auf nur eine ENI pro Gerät beschränkt sind.

  • Verbessern Sie die Netzwerkvalidierung für externe Amazon EFS-Dateisysteme, indem Sie den CIDR-Block in der angehängten Sicherheitsgruppe überprüfen.

  • Fügen Sie einen Validator hinzu, um zu überprüfen, ob konfigurierte Instance-Typen Platzierungsgruppen unterstützen.

  • Konfigurieren Sie NFS-Threads auf min (256, max (8, num_cores * 4)), um eine bessere Stabilität und Leistung zu gewährleisten.

  • Verschieben Sie die NFS-Installation zur Build-Zeit, um die Konfigurationszeit zu reduzieren.

  • Aktivieren Sie die serverseitige Verschlüsselung für das EcrImageBuilder SNS-Thema, das bei der Bereitstellung der AWS ParallelCluster API erstellt wird und zur Benachrichtigung bei Docker-Image-Build-Ereignissen verwendet wird.

Änderungen:

  • Ändert das Verhalten von SlurmQueues/Networking/PlacementGroup/Enabled. Es erstellt jetzt eine eindeutige verwaltete Platzierungsgruppe für jede Rechenressource anstelle einer einzigen verwalteten Platzierungsgruppe für alle Rechenressourcen.

  • Fügen Sie Unterstützung für SlurmQueues/Networking/PlacementGroup/Name als bevorzugte Benennungsmethode hinzu.

  • Verschieben Sie die Head-Knoten-Tags von Launch Template in die Instanzdefinition, um zu vermeiden, dass Head-Knoten-Tags bei Tag-Updates ersetzt werden.

  • Deaktivieren Sie Multithreading über ein Skript, das von der Startvorlage ausgeführt wird cloud-init und nicht über das in der Startvorlage CpuOptions festgelegte Skript.

  • Aktualisieren Sie Python auf Version 3.9 und NodeJS auf Version 16 in der API-Infrastruktur, dem API-Docker-Container und den Cluster-Lambda-Ressourcen.

  • Entfernen Sie die Unterstützung für Python 3.6 inaws-parallelcluster-batch-cli.

  • Führen Sie ein Upgrade von Slurm auf Version 22.05.5 (von21.08.8-2) durch.

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 470.141.03 (von470.129.06).

  • Führen Sie ein Upgrade von NVIDIA Fabric Manager auf Version 470.141.03 (von470.129.06) durch.

  • Aktualisieren Sie das NVIDIA CUDA Toolkit auf Version 11.7.1 (). from 11.4.4

  • Aktualisieren Sie Python, das in AWS ParallelCluster Virtualenvs verwendet wird, von auf. 3.7.13 3.9.15

  • Aktualisieren Sie das EFA-Installationsprogramm auf Version 1.18.0.

    • EFA-Treiber: (keine Änderung) efa-1.16.0-1

    • EFA-Konfiguration: () efa-config-1.11-1 from efa-config-1.10-1

    • EFA-Profil: efa-profile-1.5-1 (keine Änderung)

    • libFabric-aws: (von). libfabric-aws-1.16.0~amzn4.0-1 libfabric-aws-1.16.0~amzn2.0-1

    • RDMA-Core: (von) rdma-core-41.0-2 rdma-core-37.0

    • MPI öffnen: openmpi40-aws-4.1.4-2 (von) openmpi40-aws-4.1.1-2

  • Aktualisieren Sie NICE DCV auf Version 2022.1-13300 (von2022.0-12760).

  • Aktiviert die Unterdrückung von SingleSubnetValidator fürQueues.

  • Ersetzen Sie keine DRAIN Knoten, wenn sie sich im COMPLETING Status befinden, da Epilog möglicherweise noch läuft.

Fehlerbehebungen:

  • Korrigiert, dass die Überprüfung des Filterparameters im AWS ParallelCluster ListClusterLogStreams Befehl fehlschlägt, wenn falsche Filter übergeben werden.

  • Korrigiert die Validierung des Parameters SharedStorage/EfsSettings, sodass die Validierung fehlschlägt, wenn FileSystemId er zusammen mit anderen SharedStorageEfsSettings/-Parametern angegeben wurde. FileSystemIdWar bisher nicht enthalten.

  • Das Cluster-Update wurde behoben, wenn die Reihenfolge SharedStoragezusammen mit anderen Änderungen in der Konfiguration geändert wurde.

  • Fehler UpdateParallelClusterLambdaRole in der AWS ParallelCluster API behoben, in die Logs hochgeladen werden sollen CloudWatch.

  • Fix, dass Cinc bei der Installation von Paketen vor der Ausführung von Kochbüchern nicht das lokale CA-Zertifikatspaket verwendet.

  • Behebt ein Problem beim Upgraden von Ubuntu mit dem pcluster build-image eingestellten ZeitpunktBuild:UpdateOsPackages:Enabled:true.

  • Das Parsen der YAML-Cluster-Konfiguration wurde behoben, indem es bei doppelten Schlüsseln fehlschlug.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

02. November 2022

AWS ParallelCluster Nur Dokumentation, API-Referenz hinzugefügt.

AWS ParallelCluster Update nur zur Dokumentation

27. Oktober 2022

AWS ParallelCluster Version 3.2.1 veröffentlicht

AWS ParallelCluster Version 3.2.1 veröffentlicht.

Verbesserungen:

  • Verbessern Sie die Logik, um die Host-Routing-Tabellen den verschiedenen Netzwerkkarten zuzuordnen, um EC2 Amazon-Instances mit mehreren besser zu unterstützen NICs.

Änderungen:

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 470.141.03.

  • Aktualisieren Sie NVIDIA Fabric Manager auf Version 470.141.03.

  • Deaktivieren Sie die cron Jobaufgaben man-db undmlocate, was sich negativ auf die Knotenleistung auswirken kann.

  • Aktualisieren Sie die Intel MPI Library auf 2021.6.0.602.

  • Führen Sie als Reaktion auf dieses Sicherheitsrisiko ein Upgrade von Python von 3.7.10 auf 3.7.13 durch.

Fehlerbehebungen:

  • Vermeiden Sie Fehler DescribeCluster beim Einschalten, wenn die Clusterkonfiguration nicht verfügbar ist.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und den Paketen aws-parallelcluster-cookbookunter. aws-parallelcluster-node GitHub

3. Oktober 2022

AWS ParallelCluster Version 3.2.0 veröffentlicht

AWS ParallelCluster Version 3.2.0 veröffentlicht.

Verbesserungen:

Änderungen:

  • Aktualisieren Sie das EFA-Installationsprogramm auf Version 1.17.2.

    • EFA-Treiber: efa-1.16.0-1

    • EFA-Konfiguration: efa-config-1.10-1

    • EFA-Profil: efa-profile-1.5-1

    • Libfabric: libfabric-aws-1.16.0~amzn2.0-1

    • RDMA-Kern: rdma-core-41.0-2

    • MPI öffnen: openmpi40-aws-4.1.4-2

  • Aktualisieren Sie NICE DCV auf Version 2022.0-12760.

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 470.129.06.

  • Aktualisieren Sie NVIDIA Fabric Manager auf Version 470.129.06.

  • Ändern Sie die standardmäßigen EBS-Volumetypen sowohl im Stammvolume als auch in den zusätzlichen Volumes von gp2 auf gp3.

  • Änderungen an FSx für Lustre-Dateisysteme, erstellt von: AWS ParallelCluster

    • Ändern Sie den Standard-Bereitstellungstyp inScratch_2.

    • Ändern Sie die Lustre-Serverversion auf2.12.

  • Es ist nicht erforderlich, dass PlacementGroup/Enabled auf gesetzt ist, true wenn ein vorhandenesPlacementGroup/Idübergeben wird.

  • Erlaubt nicht,PlacementGroup/zu setzenId, wennPlacementGroup/explizit auf gesetzt Enabled istfalse.

  • Füge allen Ressourcen, die von erstellt wurden, ein parallelcluster:cluster-name Tag hinzu AWS ParallelCluster.

  • Fügt lambda:UntagResource dem AWS ParallelCluster API-Stack für das Cluster-Update hinzu lambda:ListTags und ParallelClusterUserRole wird vom API-Stack verwendet.

  • Beschränken IPv6 Sie den IMDS Zugriff nur auf Root- und Cluster-Admin-Benutzer, wenn der Konfigurationsparameter HeadNodeImds//aktiviert Secured ist.

  • Verwenden Sie bei einem benutzerdefinierten AMI die Größe des AMI-Root-Volumes anstelle der ParallelCluster Standardgröße von 35 GiB. Der Wert kann in der Cluster-Konfigurationsdatei geändert werden.

  • Automatische Deaktivierung der Rechenflotte, wenn der KonfigurationsparameterScheduling//SlurmQueuesComputeResources/unter dem erforderlichen Mindestpreis für die Erfüllung von Spot-Anfragen SpotPrice liegt.

  • Zeigt requested_value current_value Werte im Änderungssatz an, wenn während einer Aktualisierung ein Abschnitt hinzugefügt oder entfernt wird.

  • Deaktivieren Sie den in Deep Learning verfügbaren aws-ubuntu-eni-helper Dienst AMIs, um Konflikte configure_nw_interface.sh bei der Konfiguration von Instanzen mit mehreren Netzwerkkarten zu vermeiden.

  • Entfernen Sie die Unterstützung für Python 3.6.

  • Setzen Sie MTU für alle Netzwerkschnittstellen auf 9001, wenn Sie Instanzen mit mehreren Netzwerkkarten konfigurieren.

  • Entfernen Sie den letzten Punkt, wenn Sie den FQDN des Compute-Knotens konfigurieren.

  • Verwalten Sie statische Knoten in. POWERING_DOWN

  • Ersetzt den dynamischen Knoten nicht, POWER_DOWN da Jobs möglicherweise noch ausgeführt werden.

  • Neustart clustermgtd und slurmctld Daemons bei der Cluster-Aktualisierung nur dann, wenn die Scheduling Parameter in der Clusterkonfiguration aktualisiert werden.

  • Update slurmctld - und slurmd systemd Servicedateien.

  • Beschränken IPv6 Sie den Zugriff auf IMDS nur auf Root- und Cluster-Admin-Benutzer, wenn der KonfigurationsparameterHeadNode/Imds/aktiviert Secured ist.

  • Stellen Sie die Slurm-Konfiguration so einAuthInfo=cred_expire=70, dass die Zeit in der Warteschlange reduziert wird. Jobs müssen warten, bevor sie erneut gestartet werden, wenn Knoten nicht verfügbar sind.

  • Aktualisieren Sie die Abhängigkeiten von Drittanbieter-Kochbüchern:

    • apt-7.4.2 (von apt-7.4.0)

    • Line-4.5.2 (von Line-4.0.1)

    • openssh-2.10.3 (von openssh-2.9.1)

    • pyenv-3.5.1 (von pyenv-3.4.2)

    • selinux-6.0.4 (von selinux-3.1.1)

    • yum-7.4.0 (von yum-6.1.1)

    • yum-epel-4.5.0 (von yum-epel-4.1.2)

Fehlerbehebungen:

  • Korrigieren Sie das Standardverhalten, bei dem die AWS ParallelCluster Validierungs- und Testschritte beim Erstellen eines benutzerdefinierten AMI übersprungen werden.

  • Behebt ein Leck im Datei-Handlecomputemgtd.

  • Behebung eines Rennzustands, der sporadisch dazu führte, dass gestartete Instances sofort beendet wurden, weil sie in der EC2 DescribeInstances Antwort noch nicht verfügbar waren.

  • Korrigiert die Unterstützung für den DisableSimultaneousMultithreading Parameter bei Instance-Typen mit ARM-Prozessoren.

  • Behebung eines Fehlers beim AWS ParallelCluster API-Stack-Update beim Upgrade von einer früheren Version. Fügen Sie das für die ListImagePipelineImages Aktion verwendete Ressourcenmuster in hinzuEcrImageDeletionLambdaRole.

  • AWS ParallelCluster Korrigiert das Hinzufügen fehlender Berechtigungen, die für den Import oder Export aus Amazon S3 bei der Erstellung eines FSx for Lustre-Dateisystems erforderlich sind.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

27. Juli 2022

AWS ParallelCluster Bisher wurden in diesem Jahr nur Dokumentationsaktualisierungen durchgeführt

AWS ParallelCluster Updates nur für die Dokumentation.

Neue Abschnitte:

Aktualisierungen des Abschnitts:

6. Juli 2022

AWS ParallelCluster Version 3.1.4 veröffentlicht

AWS ParallelCluster Version 3.1.4 veröffentlicht.

Verbesserungen:

  • Fügen Sie die Validierung für DirectoryService/PasswordSecretArnhinzu, damit sie fehlschlägt, wenn das Geheimnis nicht existiert.

    Unterstützung für die Aktivierung der JWT-Authentifizierung (Slurm) hinzugefügt.

Änderungen:

  • Aktualisieren Sie Slurm auf Version 21.08.8-2.

  • Erstellen Sie Slurm mit JWT-Unterstützung.

  • Es ist nicht erforderlich, dass PlacementGroup/Enabled auf gesetzt ist, true wenn ein PlacementGroup vorhandenes/übergeben wird. Id

  • ParallelClusterUserRoleWird vom ParallelCluster API-Stack für die Clustererstellung und Image-Erstellung verwendet. lambda:TagResource

Fehlerbehebungen:

  • Korrigiert die Fähigkeit, die Logs eines Clusters zu exportieren, wenn der export-cluster-logs Befehl mit der --filters Option verwendet wird.

  • Richten Sie den AWS Batch Docker-Einstiegspunkt so ein, dass er ein /home gemeinsam genutztes Verzeichnis verwendet, um die Multi-node-Parallel Jobausführung zu koordinieren.

  • Setzen Sie die Knotenadresse zurück, wenn Sie Slurm Unhealthy static node auf down setzen, um zu verhindern, dass ein statischer Knoten, der aufgrund unzureichender Kapazität ausgefallen ist, als Bootstrap-Ausfallknoten behandelt wird.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

16. Mai 2022

AWS ParallelCluster Version 3.1.3 veröffentlicht

AWS ParallelCluster Version 3.1.3 veröffentlicht.

Verbesserungen:

  • Führen Sie die SSH-Schlüsselerstellung zusammen mit der Erstellung des HOME-Verzeichnisses aus, z. B. während der SSH-Anmeldung, wenn Sie zu einem anderen Benutzer wechseln und wenn Sie einen Befehl als ein anderer Benutzer ausführen.

  • Fügen Sie im Konfigurationsparameter/Unterstützung für FQDN und LDAP Distinguished Names hinzu. DirectoryServiceDomainName Der neue Validator überprüft jetzt beide Syntaxen.

  • Das neue update_directory_service_password.sh Skript, das auf dem Hauptknoten bereitgestellt wird, unterstützt die manuelle Aktualisierung des Active Directory-Passworts in der SSSD-Konfiguration. Das Passwort wird vom AWS Secrets Manager aus der Cluster-Konfiguration abgerufen.

  • Fügen Sie Unterstützung für die Bereitstellung der API-Infrastruktur in Umgebungen ohne Standard-VPC hinzu.

Änderungen:

  • Deaktiviert tiefere C-States in x86_64 (offiziell AMIs und per build-image Befehl AMIs erstellt), um eine hohe Leistung und geringe Latenz zu gewährleisten.

  • Aktualisierungen von Betriebssystempaketen und Sicherheitskorrekturen.

  • Ändern Sie die Amazon Linux 2-Basis-Images zur Verwendung AMIs mit Kernel 5.10.

Fehlerbehebungen:

  • Korrigieren Sie den Build-Image-Stack DELETE_FAILED nach erfolgreicher Image-Erstellung aufgrund neuer EC2 Image Builder Builder-Richtlinien.

  • Korrigieren Sie den Konfigurationsparameter DirectoryService//DomainAddrconversion to ldap_uri SSSD-Eigenschaft, wenn er mehrere Domainadressen enthält.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbook GitHub

20. April 2022

AWS ParallelCluster Version 3.1.2 veröffentlicht

AWS ParallelCluster Version 3.1.2 veröffentlicht.

Änderungen:

  • Aktualisieren Sie Slurm auf Version 21.08.6 (von21.08.5).

Fehlerbehebungen:

  • Korrigieren Sie das Update der /etc/hosts Datei auf Rechenknoten, wenn ein Cluster in Subnetzen ohne Internetzugang bereitgestellt wird.

  • Korrigieren Sie den Bootstrap der Rechenknoten so, dass sie auf die Initialisierung kurzlebiger Laufwerke warten, bevor sie dem Cluster beitreten.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-Paket unter. GitHub

2. März 2022

AWS ParallelCluster Version 3.1.1 veröffentlicht

AWS ParallelCluster Version 3.1.1 veröffentlicht.

  • Fügen Sie Unterstützung für Clusterumgebungen mit mehreren Benutzern hinzu, indem Sie Active Directory-Domänen (AD) integrieren, die über den AWS Directory Service verwaltet werden.

  • Fügen Sie der Cluster-Konfigurationsdatei Unterstützung für UseEc2 Hostnamen hinzu. Wenn auf true gesetzt, verwenden Sie EC2 Amazon-Standard-Hostnamen (z. B. ip-1-2-3-4) für Rechenknoten.

  • Fügen Sie Unterstützung für die Clustererstellung in Subnetzen ohne Internetzugang hinzu.

  • Fügen Sie Unterstützung für mehrere Compute-Instance-Typen pro Warteschlange hinzu.

  • Fügen Sie Unterstützung für GPU-Planung mit Slurm auf ARM-Instanzen mit NVIDIA-Karten hinzu.

  • Fügen Sie der AWS ParallelCluster CLI abgekürzte Flags für cluster-name region (-n-r), image-id (-i), () undcluster-configuration/image-configuration(-c) hinzu.

  • Unterstützung für die NEW_CHANGED_DELETED Option FSx für den AutoImportPolicyLustre-Parameter hinzugefügt.

  • parallelcluster:compute-resource-nameTag zu EC2 LaunchTemplates Ressourcen hinzufügen, die von Rechenknoten verwendet werden.

  • Verbessern Sie die innerhalb des Clusters erstellten Sicherheitsgruppen, um eingehende Verbindungen von benutzerdefinierten Sicherheitsgruppen zuzulassen, wenn SecurityGroups Parameter für einige and/or Warteschlangen am Hauptknoten angegeben sind.

  • Installieren Sie die NVIDIA-Treiber und die CUDA-Bibliothek für ARM.

Änderungen:

  • Aktualisieren Sie Slurm auf Version 21.08.5 (von20.11.8).

  • Aktualisieren Sie das Slurm-Plugin auf Version 21.08 (von20.11).

  • Aktualisieren Sie NICE DCV auf Version 2021.3-11591 (von2021.1-10851).

  • Aktualisieren Sie den NVIDIA-Treiber auf Version 470.103.01 (von470.57.02).

  • Aktualisieren Sie den NVIDIA Fabric Manager auf Version 470.103.01 (von470.57.02).

  • Aktualisieren Sie CUDA auf Version 11.4.4 (von11.4.0).

  • Intel MPI wurde auf Version 2021 Update 4 aktualisiert (aktualisiert von Version 2019 Update 8). Weitere Informationen finden Sie unter Intel® MPI Library 2021 Update 4.

  • Führen Sie ein PMIx Upgrade auf Version 3.2.3 (von3.1.5) durch.

  • Entfernen Sie das Dumping ausgefallener Rechenknoten nach/home/logs/compute. Protokolldateien für Rechenknoten sind in CloudWatch und in EC2 Amazon-Konsolenprotokollen verfügbar.

  • Aktivieren Sie die Möglichkeit, Validatoren zu unterdrücken SlurmQueues und zu ComputeResources verlängern.

  • Deaktivieren Sie das Paket-Update beim Start der Instance auf Amazon Linux 2.

  • Deaktivieren Sie die EC2 ImageBuilder erweiterten Bildmetadaten von Amazon, wenn Sie AWS ParallelCluster benutzerdefinierte Bilder erstellen.

  • Legen Sie die cloud-init Datenquelle explizit auf fest. EC2 Dies spart Startzeit für Ubuntu- und CentOS-Plattformen.

  • Verwenden Sie im Namen der Vorlage für den Start der Rechenflotte den Namen der Rechenressource anstelle des Instanztyps.

  • Leitet stderr und stdout zur CLI-Protokolldatei um, um unerwünschten Text in der pcluster-CLI-Ausgabe zu verhindern.

  • Verschiebe die configure/install Rezepte in separate Kochbücher, die vom Hauptbuch aufgerufen werden. Bestehende Einstiegspunkte werden beibehalten und sind abwärtskompatibel.

  • Laden Sie die Abhängigkeiten der Intel HPC-Plattform während der AMI-Build-Zeit herunter, um zu vermeiden, dass während der Clustererstellung eine Verbindung zum Internet hergestellt wird.

  • Entfernen Sie bei der Konfiguration - von Slurm-Knoten nicht den Namen der Rechenressource.

  • Konfigurieren Sie nicht GPUs in Slurm, wenn der NVIDIA-Treiber nicht installiert ist.

  • Korrigieren Sie ecs:ListContainerInstances die Erlaubnis inBatchUserRole.

  • Korrigiert den Export von Clusterprotokollen, wenn kein Präfix angegeben wurde, das zuvor in ein None Präfix exportiert wurde.

  • Behebt, dass das Rollback nicht durchgeführt wird, wenn das Cluster-Update fehlschlägt.

  • Korrigieren Sie ecs:ListContainerInstances die Berechtigung inBatchUserRole.

  • Korrigieren Sie das RootVolume Schema für, HeadNode indem Sie einen Fehler auslösen, wenn ein nicht unterstütztes Objekt angegeben KmsKeyId wird.

  • Korrigieren Sie die FSx fehlenden Kennzahlen bei Amazon, die im CloudWatch Dashboard angezeigt werden sollen.

  • KorrigierenEfaSecurityGroupValidator. Bisher konnte es zu falschen Fehlern kommen, wenn benutzerdefinierte Sicherheitsgruppen bereitgestellt und EFA aktiviert war.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

10. Februar 2022

AWS ParallelCluster Version 3.0.3 veröffentlicht

AWS ParallelCluster Version 3.0.3 veröffentlicht.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und die Pakete auf. aws-parallelcluster-cookbook GitHub

17. Januar 2022

AWS ParallelCluster Version 3.0.2 veröffentlicht

AWS ParallelCluster Version 3.0.2 veröffentlicht.

Führen Sie ein Upgrade des Elastic Fabric Adapter-Installationsprogramms auf Version 1.14.1 durch

  • EFA-Konfiguration: efa-config-1.9-1 (von) efa-config-1.9

  • EFA-Profil: efa-profile-1.5-1 (von) efa-profile-1.5

  • EFA-Kernel-Modul: efa-1.14.2 (von) efa-1.13.0

  • RDMA-Kern: rdma-core-37.0 (von) rdma-core-35

  • Libfabric: libfabric-1.13.2 (von) libfabric-1.13.0

  • MPI öffnen: openmpi40-aws-4.1.1-2 (keine Änderung)

GPUDirect RDMA ist immer aktiviert, wenn es vom Instanztyp unterstützt wird. Die GdrSupportKonfigurationsoption hat keine Auswirkung.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

5. November 2021

AWS ParallelCluster Version 3.0.1 veröffentlicht

AWS ParallelCluster Version 3.0.1 veröffentlicht.

Tool zur Migration der Clusterkonfiguration

Der Hauptknoten kann gestoppt werden

  • Nach dem Stoppen der Rechenflotte kann der Hauptknoten mithilfe der EC2 Amazon-Konsole oder des CLI-Befehls stop-instances AWS gestoppt und später neu gestartet werden.

Aus der Datei gelesene AWS Standardregion ~/.aws/config

  • Wenn für den Befehl pcluster die AWS Region nicht in der Konfigurationsdatei, in der Umgebung oder in der Befehlszeile angegeben ist, wird die AWS Standardregion verwendet, die in der region Einstellung im [default] Abschnitt der ~/.aws/config Datei angegeben ist.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

27. Oktober 2021

AWS ParallelCluster Version 3.0.0 veröffentlicht

AWS ParallelCluster Version 3.0.0 veröffentlicht.

Support für Clustermanagement über Amazon API Gateway

  • Kunden können jetzt Cluster über HTTP-Endpunkte mit Amazon API Gateway verwalten und bereitstellen. Dies eröffnet neue Möglichkeiten für skriptgesteuerte oder ereignisgesteuerte Workflows.

    Die AWS ParallelCluster Befehlszeilenschnittstelle (CLI) wurde ebenfalls aus Gründen der Kompatibilität mit dieser API neu gestaltet und enthält eine neue JSON-Ausgabeoption. Diese neue Funktionalität ermöglicht es Kunden, ähnliche Bausteinfunktionen auch über die CLI zu implementieren.

Verbesserte benutzerdefinierte AMI-Erstellung

  • Kunden haben jetzt Zugriff auf einen robusteren Prozess für die Erstellung und Verwaltung benutzerdefinierter AMIs Daten mit EC2 Image Builder. Benutzerdefiniert AMIs können jetzt über eine separate AWS ParallelCluster Konfigurationsdatei verwaltet und mit dem Befehl pcluster build-image in der AWS ParallelCluster Befehlszeilenschnittstelle erstellt werden.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für den aws-parallelcluster und in den Paketen unter. aws-parallelcluster-cookbookaws-parallelcluster-node GitHub

10 September 2021

PCUI
Änderung Beschreibung Datum

PCI-Version 2025.04.0 veröffentlicht

PCI-Version 2025.04.0 veröffentlicht

Bahnbrechende Änderungen:

  • Entfernen Sie den Standardwert für die PC-Version. Jetzt muss der Benutzer die zu verwendende PC-Version angeben.

Features:

  • Fügen Sie den neuen Stack-Parameter AdditionalPoliciesPCAPI '' hinzu, um zusätzlich zu den Standardberechtigungen benutzerdefinierte Berechtigungen für die ParallelCluster API-Lambda-Rolle hinzuzufügen.

Fehlerbehebungen:

  • Korrigieren Sie die PCUI-Bereitstellung in privaten Subnetzen, indem Sie dafür sorgen, dass die PCII-Vorlage die richtige verwendet und zurückgibt. URLs

  • Behebt ein Problem, das das Laden von mehr als 200 Jobs auf der Registerkarte Jobstatus verhindert. (Siehe https://github.com/aws/aws-parallelcluster-ui/issues/376).

Sicherheit:

16. April 2025

PCI-Version 2024.11.0 veröffentlicht

PCI-Version 2024.11.0 veröffentlicht

Fehlerbehebungen:

  • Legen Sie die Richtlinie explizit für ein privates ECR-Repository fest, um zu verhindern, dass die Richtlinie bei einem Stack-Update entfernt wird, das sich auf eine Lambda-Funktion auswirkt. Die Richtlinie umfasst die Berechtigungen, die für die Lambda-Funktion zum Abrufen des Codes erforderlich sind.

22. November 2024

PCI-Version 2024.10.0 veröffentlicht

PCI-Version 2024.10.0 veröffentlicht

Änderungen:

  • Unterstützung für AWS ParallelCluster 3.11.1 hinzugefügt.

  • Fügen Sie im Assistenten Unterstützung für On-Demand-Kapazitätsreservierungen und Kapazitätsblöcke hinzu.

  • Fügen Sie der Liste der unterstützten Instance-Typen im Assistenten die Familien g6, m7 und p5 hinzu.

  • Fügen Sie neue optionale Stack-Parameter hinzu, um eine benutzerdefinierte Domäne sowohl für PCUI als auch für Cognito zu konfigurieren.

Fehlerbehebungen:

  • Behebt einen Fehler, der die Einrichtung der benutzerdefinierten Domain unterbrach.

Sicherheit:

  • Aktualisieren Sie Flask-CORS von 3.0.10 auf 4.0.2, um die Sicherheitslücke CVE-2024-6221 zu schließen.

  • Führen Sie ein Upgrade von Lint-Staged von 13.0.3 auf 15.2.5 durch, um die Sicherheitslücke CVE-2024-4068 zu schließen.

  • Vollständiges Changelog

22. Oktober 2024

PCI-Version 2024.05.0 veröffentlicht

PCI-Version 2024.05.0 veröffentlicht.

Fehlerbehebungen:

  • Es wurde ein Fehler im Frontend behoben, der die Benutzeroberfläche blockierte, wenn der Benutzer das Jobstatus-Panel öffnete.

  • Vollständiges Changelog

14. Mai 2024

PCI-Version 2024.04.0 veröffentlicht

PCI-Version 2024.04.0 veröffentlicht.

Features:

17. April 2024

PCI-Version 2024.03.0 veröffentlicht

PCI-Version 2024.03.0 veröffentlicht.

Features:

  • Unterstützung für Version 3.9.0 hinzugefügt AWS ParallelCluster

  • Unterstützung für Ubuntu 22.04 und Red Hat Enterprise Linux 9 hinzugefügt

  • Ubuntu 18.04 ist veraltet

Fehlerbehebungen

  • Es wurde ein Problem behoben, das dazu führte, dass einige Cluster nicht angezeigt wurden, wenn viele Cluster verwendet wurden

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-uiPaket unter GitHub.

12. März 2024

PCI-Version 2024.02.0 veröffentlicht

PCI-Version 2024.02.0 veröffentlicht

Änderungen:

  • Die Lambda-Laufzeitumgebung wurde auf Python v3.9 aktualisiert

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-uiPaket unter. GitHub

8. Februar 2024

PCI-Version 2023.12.0 veröffentlicht

PCI-Version 2023.12.0 veröffentlicht.

Features:

  • Unterstützung für die PCI-Bereitstellung mit privaten Netzwerken hinzugefügt.

  • Es wurde die Möglichkeit hinzugefügt, optional eine Berechtigungsgrenze auf jede IAM-Rolle anzuwenden, die von den PCUI- und PCAPI-Infrastrukturen erstellt wurde

  • Es wurde die Möglichkeit hinzugefügt, optional ein Präfix auf jede IAM-Rolle und -Richtlinie anzuwenden, die von der PCUI- und PCAPI-Infrastruktur erstellt wurden.

  • Unterstützung für ParallelCluster Version 3.8.0 ohne Funktionsparität im Assistenten hinzugefügt.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-uiPaket unter. GitHub

21. Dezember 2023

PCI-Version 2023.10.0 veröffentlicht

PCI-Version 2023.10.0 veröffentlicht.

Features:

  • Unterstützung für ParallelCluster 3.7.2 wurde hinzugefügt, wobei die Funktionsparität im Assistenten auf FSx Datei-Cache und speicherbasierte Planungskompatibilität mit mehreren Instanztypen beschränkt ist.

Fehlerbehebungen:

  • Es wurde ein Problem behoben, das zu Benutzeroberflächenfehlern führte, wenn PCUI keine Berechtigungen für die Interaktion mit dem Cost Explorer hatte.

Verbesserungen

  • Die Sicherheit wurde verbessert, indem die TTL des Zugriffstokens von 10 Minuten auf 5 Minuten reduziert wurde.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-uiPaket unter GitHub.

20. Oktober 2023

PCI-Version 2023.06.0 veröffentlicht

PCI-Version 2023.06.0 veröffentlicht.

Änderungen:

  • Die AWS ParallelCluster Standard-API-Version wurde auf 3.6.0 aktualisiert.

Fehlerbehebungen:

  • Eine fehlerhafte Bereitstellung für die Region AWS GovCloud (US-West) wurde behoben.

  • Das geteilte Panel lädt die Cluster-Details jetzt korrekt, nachdem die Erstellung gestartet wurde.

Hinweise:

  • Die Funktion zur Kostenüberwachung ist in Regionen AWS GovCloud (USA) nicht verfügbar.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-uiPaket unter GitHub.

7. Juni 2023

PCI-Version 2023.05.0 veröffentlicht

PCI-Version 2023.05.0 veröffentlicht.

Verbesserungen:

  • Fügen Sie ab AWS ParallelCluster Version 3.6.0 Unterstützung für RHEL 8 hinzu.

  • Fügen Sie die Cluster-Kostenüberwachung hinzu.

  • Erhöhen Sie ab AWS ParallelCluster Version 3.6.0 die Quoten für Warteschlangen und Rechenressourcen.

Änderungen:

  • Die Benutzeroberfläche des Assistenten zur Clustererstellung wurde verbessert.

  • Die Geschwindigkeit der PCI-Bereitstellung wurde erhöht.

  • Die Oberfläche zum Hinzufügen eines neuen Benutzers wurde verbessert.

  • Warteschlangen befinden sich standardmäßig im Hauptknoten-Subnetz.

Fehlerbehebungen:

  • Wechseln Sie nach Abschluss der Clustererstellung zur richtigen Region.

  • Korrigieren Sie die Anzeige der Ladeanzeige in der Funktion „Cluster bearbeiten“.

  • Korrigiert die Clustererstellung, wenn die SnapshotId EBS-Eigenschaft entfernt wird.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-uiPaket unter GitHub.

16. Mai 2023

PCI-Version 2023.04.0 veröffentlicht

PCI-Version 2023.04.0 veröffentlicht.

Verbesserungen:

  • Neugestaltung des Assistenten zur Clustererstellung.

  • Neugestaltung der Seite mit Cluster-Protokollen.

  • Fügen Sie eine benutzerdefinierte Namenseinstellung für gemeinsam genutzten Speicher hinzu.

  • Fügen Sie beim Hinzufügen von Speicher zu einem Cluster mehrere Speicheroptionen hinzu.

  • DeletionPolicyUnterstützung für Amazon EFS und FSx Lustre hinzugefügt.

  • ImdsSupportEinstellung zur Cluster-Konfiguration hinzufügen.

  • Unterstützung für C7-Instanztypen hinzufügen.

  • Tutorial Zurück zu einer früheren AWS Systems Manager Manager-Dokumentversion hinzugefügt.

Änderungen:

  • Cluster-Konfiguration YAML mit einer Größe von bis zu 1 MB.

  • Der Benutzer wurde aufgrund einer Autorisierung mit temporären Boto3 IAM-Anmeldeinformationen nicht abgemeldet.

  • Multi-Threading-Optionen wurden deaktiviert, wenn eine HPC-Instanz ausgewählt wurde.

  • Die Option „Rollback deaktivieren“ wurde auf der Cluster-Erstellungsseite entfernt.

  • Der Benutzer kann die PCUI nicht verwenden, bis die erforderlichen Informationen bereitgestellt wurden.

  • Es können bis zu 10 Warteschlangen hinzugefügt werden.

  • Das SSM-SessionManagerRunShell Dokument wird während der PCUI-Installation nicht überschrieben.

Fehlerbehebungen:

  • Korrigiert den defekten Link zum Zurücksetzen des Passworts

  • Fehler beheben, der delete stack dadurch verursacht wurde, dass er EcrPrivateRepository nicht leer war

  • Das Initialisierungsproblem des Kästchens „SSH-Schlüssel generieren“ im Abschnitt „Eigenschaften für die Verwaltung mehrerer Benutzer“ wurde behoben.

  • Ein Absturz, der durch einen Job mit undefinierten Eigenschaften verursacht wurde, wurde behoben.

  • Die FSx SCRATCH-Einstellungen wurden korrigiert.

  • Die Schaltflächen „Instanzen starten“ und „Stoppen“ wurden behoben, die auch nach einmaligem Klicken immer noch aktiviert sind.

Einzelheiten zu den Änderungen finden Sie in den CHANGELOG Dateien für das aws-parallelcluster-uiPaket unter GitHub.

17. April 2023

Terraform
Änderung Beschreibung Datum

Terraform Provider für 1.1.0 veröffentlicht AWS ParallelCluster

Fehlerbehebungen:

  • Es wurde ein Problem behoben, das dazu führte, dass Terraform-Apply fehlschlug, wenn ParallelCluster API 3.11.x zur Bereitstellung von Clustern mit Anmeldeknoten verwendet wurde.

6. Dezember 2024

Terraform-Modul für 1.1.0 veröffentlicht AWS ParallelCluster

Änderungen:

  • Verwenden Sie AWS ParallelCluster Terraform Provider 1.x in allen Modulbeispielen.

  • Verwenden Sie ParallelCluster API 3.11.1 in allen Beispielen mit Stack-Namen-API. ParallelCluster

  • Stellen Sie Login-Knoten in allen Modulbeispielen bereit.

6. Dezember 2024

Terraform Provider für 1.0.0 veröffentlicht AWS ParallelCluster

Features:

26. Juni 2024

Terraform-Modul für 1.0.0 veröffentlicht AWS ParallelCluster

Features:

26. Juni 2024