Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Versionshinweise für Slurm-Versionen in PCS AWS
Dieses Thema beschreibt wichtige Änderungen für jede Slurm-Version, die derzeit in AWS PCS unterstützt wird. Wir empfehlen Ihnen, die Änderungen zwischen der alten und der neuen Version zu überprüfen, wenn Sie Ihren Cluster aktualisieren.
In PCS implementierte Änderungen AWS
-
Der Slurm requeue_on_resume_failure ist jetzt standardmäßig SchedulerParameter aktiviert.
-
„stderr“ wurde als Option für entfernt, da es in Slurm 25.05 deaktiviert wurde. LogTimeFormat
-
AWS PCS unterstützt die Sackd-Konfiguration mit mehreren Clustern: Der Anmeldeknoten kann auf mehrere Cluster zugreifen.
Weitere Informationen zu Slurm 25.05 finden Sie in den folgenden Publikationen:
-
Ankündigung der Veröffentlichung von SchedMD: https://www.schedmd.com/slurm-version-25-05-0-is-now-available/
In PCS implementierte Änderungen AWS
-
AWS PCS unterstützt Slurm Accounting. Weitere Informationen finden Sie unter Slurm-Buchhaltung in PCS AWS.
Weitere Informationen zu Slurm 24.11 finden Sie in den folgenden Veröffentlichungen:
In PCS implementierte Änderungen AWS
-
Das neue Slurm Step Manager-Modul ist jetzt standardmäßig in AWS PCS aktiviert. Dieses Modul bietet erhebliche Vorteile, da das Schrittmanagement vom zentralen Controller auf die Rechenknoten verlagert wird, wodurch die Parallelität der Systeme in Umgebungen mit starker Schrittnutzung erheblich verbessert wird. Um diese Konfiguration zu unterstützen und die Ausführung besser zu isolieren
Prologund zuEpilogverarbeiten, wurden neue Prolog-Flags (Contain,Alloc) aktiviert. -
Die hierarchische Kommunikation vom Controller zu den Rechenknoten wird aktiviert, um die Kommunikation zwischen Slurm-Knoten zu optimieren und so die Skalierbarkeit und Leistung zu verbessern. Darüber hinaus verwendet die Routing-Konfiguration jetzt Partitionsknotenlisten für die Kommunikation vom Controller anstelle des Standard-Routing-Algorithmus des Plugins, wodurch die Systemstabilität verbessert wird.
-
Ein neues Hash-Plugin
HashPlugin=hash/sha3ersetzt das vorherigehash/k12 plugin. Dies ist jetzt standardmäßig in AWS PCS-Clustern aktiviert. -
Die Slurm-Controller-Logs enthalten jetzt erweiterte Auditing-Funktionen für alle eingehenden Remote Procedure Calls (RPC).
slurmctldDie Protokolle enthalten die Quelladresse, den authentifizierten Benutzer und den RPC-Typ vor der Verbindungsverarbeitung.
Weitere Informationen zu Slurm 24.05 finden Sie in den folgenden Veröffentlichungen:
Slurm-Einstellungen, die Sie in PCS ändern können AWS
-
Die
SuspendTimeStandardeinstellung ist.60Verwenden Sie den AWSscaleDownIdleTimeInSecondsPCS-Konfigurationsparameter, um ihn festzulegen. Weitere Informationen finden Sie unter demscaleDownIdleTimeInSecondsParameter desClusterSlurmConfigurationDatentyps in der AWS PCS-API-Referenz. -
Der
MaxJobCountWert undMaxArraySizebasiert auf der Größe, die Sie für den Cluster auswählen. Weitere Informationen finden Sie unter demsizeParameter derCreateClusterAPI-Aktion in der AWS PCS-API-Referenz. -
Die
SelectTypeParametersSlurm-Einstellung ist standardmäßig auf.CR_CPUSie können ihn als Wert angeben,slurmCustomSettingsum ihn bei der Erstellung eines Clusters festzulegen. Weitere Informationen finden Sie imslurmCustomSettingsParameter derCreateClusterAPI-Aktion und SlurmCustomSettingin der AWS PCS-API-Referenz. -
Sie können
PrologundEpilogauf Clusterebene festlegen. Sie können es als Wert angebenslurmCustomSettings, um es festzulegen, wenn Sie einen Cluster erstellen. Weitere Informationen finden Sie unterCreateClusterund SlurmCustomSettingin der AWS PCS-API-Referenz. -
Sie können
WeightundRealMemoryauf der Ebene der Compute-Knotengruppen festlegen. Sie können es als Wert angeben,slurmCustomSettingsum es festzulegen, wenn Sie eine Compute-Knotengruppe erstellen. Weitere Informationen finden Sie unterCreateComputeNodeGroupund SlurmCustomSettingin der AWS PCS-API-Referenz.