

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Aktualisierung eines Clusters in AWS PCS
<a name="working-with_clusters_update"></a>

AWS Mit PCS können Sie Clusterkonfigurationen nach der Erstellung über die UpdateCluster API oder Konsole aktualisieren. Sie können die Cluster-Einstellungen ändern, ohne Ihre Infrastruktur neu aufbauen zu müssen, wodurch der Betriebsaufwand reduziert und Unterbrechungen minimiert werden.

## Vorteile von Cluster-Updates
<a name="update-cluster-benefits"></a>

Durch die Aktualisierung von AWS PCS-Clustern können Sie die HPC-Infrastruktur ohne Betriebsunterbrechung an neue Anforderungen anpassen. Konfigurationsänderungen dauern Minuten statt der Stunden oder länger, die für die Neuerstellung von Clustern erforderlich sind. Diese Funktion ist wichtig für Produktionsumgebungen, die nur minimale Ausfallzeiten erfordern, und für Teams, die Clustereinstellungen anpassen müssen, wenn sich die Arbeitslastmuster ändern.

## Unterstützte Konfigurationsänderungen
<a name="update-cluster-supported-settings"></a>

Sie können drei Hauptkategorien von Einstellungen ändern:
+ **Kontoführungskonfiguration** — Aktivieren oder deaktivieren Sie die verwaltete Buchhaltung und konfigurieren Sie die Aufbewahrungseinstellungen.
+ **Verhalten beim Herunterskalieren** — Passen Sie den `scaleDownIdleTime` Parameter an, der steuert, wie lange dynamische Instanzen inaktiv bleiben, bevor AWS PCS sie automatisch beendet.
+ **Benutzerdefinierte Slurm-Einstellungen** — Ändern Sie alle unterstützten Slurm-Einstellungen, die auf Cluster-Ebene gelten, einschließlich Prolog, Epilog und. SelectTypeParameters

## Einschränkungen
<a name="update-cluster-limitations"></a>

Sie können bestimmte Konfigurationen nach der Clustererstellung nicht ändern. Dazu zählen:
+ Konfigurationen von Sicherheitsgruppen
+ Auswahl des VPC-Subnetzes
+ Cluster-Größe
+ Slurm-Version
+ Clustername

Diese Einstellungen sind grundlegend für die Architektur des Clusters und erfordern die Erstellung eines neuen Clusters, um sie zu ändern.

## Voraussetzungen für Cluster-Updates
<a name="update-cluster-prerequisites"></a>

Stellen Sie vor dem Aktualisieren eines Clusters sicher, dass die folgenden Bedingungen erfüllt sind:
+ Der Cluster muss sich im `SUSPENDED` Status `ACTIVE``UPDATE_FAILED`, oder befinden
+ Alle zugehörigen Ressourcen (Warteschlangen, Compute-Knotengruppen) müssen sich im Status befinden `ACTIVE`
+ Sie müssen über die entsprechenden IAM-Berechtigungen für den Vorgang verfügen UpdateCluster 
+ Es können keine anderen Aktualisierungsvorgänge ausgeführt werden

## Aktualisierungsprozess und Auswirkung auf den Job
<a name="update-cluster-process"></a>

Während eines Aktualisierungsvorgangs führen die Rechenknoten weiterhin bestehende Jobs aus, auch wenn der Cluster-Controller kurzzeitig nicht erreichbar ist. In diesem Zeitraum kann das System jedoch keine neuen Auftragseinreichungen annehmen oder Entscheidungen zur Terminplanung treffen.

Sie können Cluster-Updates sowohl über die Konsole als auch über die API-Schnittstelle überwachen. Der Cluster durchläuft während eines Updates die folgenden Zustände:
+ `UPDATING`- Aktualisierung läuft
+ `ACTIVE`- Das Update wurde erfolgreich abgeschlossen
+ `UPDATE_FAILED`- Beim Update ist ein Fehler aufgetreten

## Abrechnung bei Updates
<a name="update-cluster-billing"></a>

Die standardmäßigen Stundengebühren für Ihren AWS PCS-Cluster werden während der Aktualisierungsvorgänge weiterhin berechnet. Wenn Sie einen Cluster aktualisieren, um die Kontoführung zu deaktivieren, wird die Abrechnung für die Abrechnungsfunktion beendet, sobald der Cluster den `UPDATING` Status erreicht. Wenn Sie die Kontoführung aktivieren, beginnt die Abrechnung erst, wenn der Cluster das Update erfolgreich abgeschlossen hat und in den `ACTIVE` Status zurückkehrt.

**Topics**
+ [Vorteile von Cluster-Updates](#update-cluster-benefits)
+ [Unterstützte Konfigurationsänderungen](#update-cluster-supported-settings)
+ [Einschränkungen](#update-cluster-limitations)
+ [Voraussetzungen für Cluster-Updates](#update-cluster-prerequisites)
+ [Aktualisierungsprozess und Auswirkung auf den Job](#update-cluster-process)
+ [Abrechnung bei Updates](#update-cluster-billing)
+ [Aktualisieren Sie einen AWS PCS-Cluster](working-with_clusters_update_procedure.md)
+ [Häufig gestellte Fragen zur Aktualisierung von Clustern in AWS PCS](working-with_clusters_update_faq.md)
+ [Problembehandlung bei AWS PCS-Cluster-Updates](working-with_clusters_update_troubleshooting.md)

# Aktualisieren Sie einen AWS PCS-Cluster
<a name="working-with_clusters_update_procedure"></a>

Gehen Sie wie folgt vor, um die Scheduler-Einstellungen, die Accounting-Konfiguration und die benutzerdefinierten Slurm-Einstellungen auf Ihrem Cluster zu ändern. Weitere Informationen finden Sie unter [Benutzerdefinierte Slurm-Einstellungen für AWS PCS-Cluster](slurm-custom-settings-cluster.md).

## Voraussetzungen
<a name="update-cluster-procedure-prerequisites"></a>
+ Der Cluster muss sich im Status `ACTIVE``UPDATE_FAILED`, oder befinden `SUSPENDED`
+ Alle zugehörigen Ressourcen (Warteschlangen, Compute-Knotengruppen) müssen sich im Status befinden `ACTIVE`
+ Es können keine anderen Aktualisierungsvorgänge ausgeführt werden

## Verfahren
<a name="update-cluster-procedure-steps"></a>

------
#### [ AWS-Managementkonsole ]

1. Öffnen Sie die AWS PCS-Konsole unter [https://console.aws.amazon.com/pcs/](https://console.aws.amazon.com/pcs/).

1. Klicken Sie im Navigationsbereich auf **Cluster**.

1. Wählen Sie den zu aktualisierenden Cluster aus.

1. Wählen Sie **Bearbeiten** aus.

1. Ändern Sie auf der Seite Cluster bearbeiten die gewünschten Einstellungen:
   + Aktualisieren Sie unter **Scheduler-Konfiguration** die **Leerlaufzeit von Scale-down**, um zu steuern, wie lange dynamische Instances inaktiv bleiben, bevor sie automatisch beendet werden.
   + Ändern Sie die **Parametereinstellungen für Prolog**, **Epilog** und **Select** nach Bedarf.
   + **Aktivieren, deaktivieren oder konfigurieren Sie die Aufbewahrungszeit für Managed Accounting.**
   + Fügen Sie unter **Zusätzliche Scheduler-Einstellungen** **benutzerdefinierte Slurm-Einstellungen** hinzu, bearbeiten oder entfernen Sie sie. Weitere Informationen zu unterstützten Parametern finden Sie unter. [Benutzerdefinierte Slurm-Einstellungen für AWS PCS-Cluster](slurm-custom-settings-cluster.md)
**Anmerkung**  
Felder, die nicht bearbeitet werden können, werden schreibgeschützt angezeigt und zeigen ihre aktuellen Werte an.

1. Wählen Sie „**Aktualisieren**“, um die Änderungen zu senden.

1. Überwachen Sie den Cluster-Status, der während des Vorgangs als „Aktualisierung“ angezeigt wird. Der Status ändert sich, wenn das Update erfolgreich abgeschlossen wurde.

------
#### [ AWS CLI ]

1. Öffnen Sie ein Terminal oder eine Befehlszeile.

1. Überprüfen Sie den Clusterstatus mit dem folgenden Befehl:

   ```
   aws pcs get-cluster --cluster-identifier my-cluster
   ```

1. Senden Sie eine Aktualisierungsanfrage anhand eines der folgenden Beispiele:
   + So aktivieren Sie Managed Accounting:

     ```
     aws pcs update-cluster --cluster-identifier my-cluster \
     --slurm-configuration 'accounting={mode=STANDARD}'
     ```
   + Um eine Slurm Prolog-Einstellung zu aktualisieren:

     ```
     aws pcs update-cluster --cluster-identifier my-cluster \
     --slurm-configuration \
     'SlurmCustomSettings=[{parameterName=Prolog,parameterValue="/path/to/prolog.sh"}]'
     ```
   + Um die Leerlaufzeit beim Herunterskalieren zu aktualisieren:

     ```
     aws pcs update-cluster --cluster-identifier my-cluster \
     --slurm-configuration 'scaleDownIdleTimeInSeconds=300'
     ```

1. Überwachen Sie den Aktualisierungsfortschritt, indem Sie den Clusterstatus überprüfen:

   ```
   aws pcs get-cluster --cluster-identifier my-cluster
   ```

Nach einer erfolgreichen Aktualisierungsanforderung gibt der Befehl das Cluster-Objekt mit allen Änderungen zurück. Der Clusterstatus ändert sich von `UPDATING` bis nach `ACTIVE` Abschluss.

------

# Häufig gestellte Fragen zur Aktualisierung von Clustern in AWS PCS
<a name="working-with_clusters_update_faq"></a>

Hier erhalten Sie Antworten auf häufig gestellte Fragen zur Aktualisierung von Clusterkonfigurationen in AWS PCS.

**Welche Einstellungen kann ich ändern?**  
Sie können die Kontoführungskonfiguration (verwaltetes Accounting aktivieren/deaktivieren), das Scale-Down-Verhalten (scaleDownIdleZeitparameter) und alle unterstützten benutzerdefinierten Slurm-Einstellungen, die auf Clusterebene gelten, ändern. Sie können Sicherheitsgruppen, VPC-Subnetze, Clustergröße, Slurm-Version oder Clusternamen nicht ändern.

**Kann ich mehrere Updates in die Warteschlange stellen?**  
Nein. Sie müssen warten, bis der Cluster wieder in den `ACTIVE` Status zurückkehrt, bevor Sie ein weiteres Update einreichen. Alle zugehörigen Ressourcen (Warteschlangen, Compute-Knotengruppen) müssen sich ebenfalls im `ACTIVE` Status befinden.

**Kann ich einen Cluster-Aktualisierungsvorgang abbrechen?**  
Nein, Sie können einen laufenden Cluster-Aktualisierungsvorgang nicht abbrechen.

**Kann ich Jobs einreichen, während mein Cluster aktualisiert wird?**  
Wir empfehlen, dass Sie das Senden von Jobs während der Cluster-Updates vermeiden. Der Slurm-Controller ist während des Aktualisierungsvorgangs möglicherweise nicht verfügbar.

**Werden meine Jobs während der Cluster-Updates weiterhin ausgeführt?**  
Ja, laufende Jobs werden weiterhin auf Rechenknoten ausgeführt, auch wenn der Cluster-Controller während des Aktualisierungsvorgangs kurzzeitig nicht erreichbar ist. Der Jobstatus wird jedoch möglicherweise erst aktualisiert, wenn der Controller wieder verfügbar ist.

**Wie wirkt sich die Aktualisierung auf die Abrechnung aus?**  
Während des Aktualisierungsvorgangs werden weiterhin die Standardgebühren pro Stunde berechnet. Wenn Sie die Kontoführung deaktivieren, wird die Abrechnung beendet, wenn der Cluster in den `UPDATING` Status wechselt. Wenn die Kontoführung aktiviert ist, beginnt die Abrechnung, wenn der Cluster erfolgreich in den `ACTIVE` Status zurückkehrt.

# Problembehandlung bei AWS PCS-Cluster-Updates
<a name="working-with_clusters_update_troubleshooting"></a>

Dieses Thema hilft Ihnen dabei, häufig auftretende Probleme zu identifizieren und zu lösen, die bei der Aktualisierung von Clusterkonfigurationen auftreten können.

## Das Update schlägt mit einem Fehler bei der Kontoführungskonfiguration fehl
<a name="update-fails-accounting-error"></a>

### Häufige Ursache
<a name="accounting-error-cause"></a>

Der Cluster wechselt in den `UPDATE_FAILED` Status und die Fehlermeldung weist auf ein Problem mit der Kontoführungskonfiguration hin. Dies tritt normalerweise auf, wenn die Accounting-Konfiguration nicht mit der aktuellen Slurm-Version kompatibel ist oder ungültige Einstellungen enthält.

### Auflösung
<a name="accounting-error-resolution"></a>

Überprüfen Sie Ihre Accounting-Einstellungen auf Kompatibilität mit der Slurm-Version Ihres Clusters und reichen Sie eine korrigierte Aktualisierungsanfrage mit gültigen Konfigurationsparametern ein.

## Das Update schlägt mit einem Fehler bei den benutzerdefinierten Einstellungen fehl
<a name="update-fails-custom-settings-error"></a>

### Häufige Ursache
<a name="custom-settings-error-cause"></a>

Der Cluster wechselt in den `UPDATE_FAILED` Status und die Fehlermeldung weist auf ein Problem mit den benutzerdefinierten Slurm-Einstellungen hin. Dies tritt auf, wenn Sie ungültige Slurm-Parameterwerte oder nicht unterstützte Parameterkombinationen angeben.

### Auflösung
<a name="custom-settings-error-resolution"></a>

Überprüfen Sie Ihre benutzerdefinierten Slurm-Einstellungen anhand der unterstützten Parameter und senden Sie eine korrigierte Aktualisierungsanforderung mit gültigen Parameterwerten und Kombinationen.

## Aktualisierungsanfrage kann nicht eingereicht werden
<a name="cannot-submit-update-request"></a>

### Häufige Ursache
<a name="submit-error-cause"></a>

Die Aktualisierungsschaltfläche ist in der Konsole deaktiviert oder die API gibt einen Fehler der Stufe 400 zurück. Dies tritt auf, wenn sich der Cluster nicht in einem geeigneten Zustand befindet, die zugehörigen Ressourcen nicht aktiv sind oder wenn in Ihrer Konfiguration Validierungsfehler vorliegen.

### Auflösung
<a name="submit-error-resolution"></a>

Warten Sie, bis der Cluster und alle zugehörigen Ressourcen den `ACTIVE` Status erreicht haben, und überprüfen Sie dann Ihre Konfiguration auf Validierungsfehler, bevor Sie die Aktualisierungsanforderung erneut einreichen.

## Validierungsfehler
<a name="validation-errors"></a>

### Häufige Ursache
<a name="validation-cause"></a>

Der Befehl kehrt sofort mit einem HTTP-Fehler der Stufe 400 und einer beschreibenden Meldung zurück. Dies ist auf ungültige Clusterstatus-, Ressourcenstatus- oder Konfigurationsparameter zurückzuführen.

### Auflösung
<a name="validation-resolution"></a>

Beheben Sie den spezifischen Validierungsfehler, der in der Antwort erwähnt wurde, und wiederholen Sie den Aktualisierungsvorgang.