Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Aktualisierung eines Clusters in AWS PCS
AWS Mit PCS können Sie Clusterkonfigurationen nach der Erstellung über die UpdateCluster API oder Konsole aktualisieren. Sie können die Cluster-Einstellungen ändern, ohne Ihre Infrastruktur neu aufbauen zu müssen, wodurch der Betriebsaufwand reduziert und Unterbrechungen minimiert werden.
Vorteile von Cluster-Updates
Durch die Aktualisierung von AWS PCS-Clustern können Sie die HPC-Infrastruktur ohne Betriebsunterbrechung an neue Anforderungen anpassen. Konfigurationsänderungen dauern Minuten statt der Stunden oder länger, die für die Neuerstellung von Clustern erforderlich sind. Diese Funktion ist wichtig für Produktionsumgebungen, die nur minimale Ausfallzeiten erfordern, und für Teams, die Clustereinstellungen anpassen müssen, wenn sich die Arbeitslastmuster ändern.
Unterstützte Konfigurationsänderungen
Sie können drei Hauptkategorien von Einstellungen ändern:
-
Kontoführungskonfiguration — Aktivieren oder deaktivieren Sie die verwaltete Buchhaltung und konfigurieren Sie die Aufbewahrungseinstellungen.
-
Verhalten beim Herunterskalieren — Passen Sie den
scaleDownIdleTimeParameter an, der steuert, wie lange dynamische Instanzen inaktiv bleiben, bevor AWS PCS sie automatisch beendet. -
Benutzerdefinierte Slurm-Einstellungen — Ändern Sie alle unterstützten Slurm-Einstellungen, die auf Cluster-Ebene gelten, einschließlich Prolog, Epilog und. SelectTypeParameters
Einschränkungen
Sie können bestimmte Konfigurationen nach der Clustererstellung nicht ändern. Dazu zählen:
-
Konfigurationen von Sicherheitsgruppen
-
Auswahl des VPC-Subnetzes
-
Cluster-Größe
-
Slurm-Version
-
Clustername
Diese Einstellungen sind grundlegend für die Architektur des Clusters und erfordern die Erstellung eines neuen Clusters, um sie zu ändern.
Voraussetzungen für Cluster-Updates
Stellen Sie vor dem Aktualisieren eines Clusters sicher, dass die folgenden Bedingungen erfüllt sind:
-
Der Cluster muss sich im
SUSPENDEDStatusACTIVEUPDATE_FAILED, oder befinden -
Alle zugehörigen Ressourcen (Warteschlangen, Compute-Knotengruppen) müssen sich im Status befinden
ACTIVE -
Sie müssen über die entsprechenden IAM-Berechtigungen für den Vorgang verfügen UpdateCluster
-
Es können keine anderen Aktualisierungsvorgänge ausgeführt werden
Aktualisierungsprozess und Auswirkung auf den Job
Während eines Aktualisierungsvorgangs führen die Rechenknoten weiterhin bestehende Jobs aus, auch wenn der Cluster-Controller kurzzeitig nicht erreichbar ist. In diesem Zeitraum kann das System jedoch keine neuen Auftragseinreichungen annehmen oder Entscheidungen zur Terminplanung treffen.
Sie können Cluster-Updates sowohl über die Konsole als auch über die API-Schnittstelle überwachen. Der Cluster durchläuft während eines Updates die folgenden Zustände:
-
UPDATING- Aktualisierung läuft -
ACTIVE- Das Update wurde erfolgreich abgeschlossen -
UPDATE_FAILED- Beim Update ist ein Fehler aufgetreten
Abrechnung bei Updates
Die standardmäßigen Stundengebühren für Ihren AWS PCS-Cluster werden während der Aktualisierungsvorgänge weiterhin berechnet. Wenn Sie einen Cluster aktualisieren, um die Kontoführung zu deaktivieren, wird die Abrechnung für die Abrechnungsfunktion beendet, sobald der Cluster den UPDATING Status erreicht. Wenn Sie die Kontoführung aktivieren, beginnt die Abrechnung erst, wenn der Cluster das Update erfolgreich abgeschlossen hat und in den ACTIVE Status zurückkehrt.