Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Problembehandlung bei AWS PCS-Cluster-Updates
Dieses Thema hilft Ihnen dabei, häufig auftretende Probleme zu identifizieren und zu lösen, die bei der Aktualisierung von Clusterkonfigurationen auftreten können.
Das Update schlägt mit einem Fehler bei der Kontoführungskonfiguration fehl
Häufige Ursache
Der Cluster wechselt in den UPDATE_FAILED Status und die Fehlermeldung weist auf ein Problem mit der Kontoführungskonfiguration hin. Dies tritt normalerweise auf, wenn die Accounting-Konfiguration nicht mit der aktuellen Slurm-Version kompatibel ist oder ungültige Einstellungen enthält.
Auflösung
Überprüfen Sie Ihre Accounting-Einstellungen auf Kompatibilität mit der Slurm-Version Ihres Clusters und reichen Sie eine korrigierte Aktualisierungsanfrage mit gültigen Konfigurationsparametern ein.
Das Update schlägt mit einem Fehler bei den benutzerdefinierten Einstellungen fehl
Häufige Ursache
Der Cluster wechselt in den UPDATE_FAILED Status und die Fehlermeldung weist auf ein Problem mit den benutzerdefinierten Slurm-Einstellungen hin. Dies tritt auf, wenn Sie ungültige Slurm-Parameterwerte oder nicht unterstützte Parameterkombinationen angeben.
Auflösung
Überprüfen Sie Ihre benutzerdefinierten Slurm-Einstellungen anhand der unterstützten Parameter und senden Sie eine korrigierte Aktualisierungsanforderung mit gültigen Parameterwerten und Kombinationen.
Aktualisierungsanfrage kann nicht eingereicht werden
Häufige Ursache
Die Aktualisierungsschaltfläche ist in der Konsole deaktiviert oder die API gibt einen Fehler der Stufe 400 zurück. Dies tritt auf, wenn sich der Cluster nicht in einem geeigneten Zustand befindet, die zugehörigen Ressourcen nicht aktiv sind oder wenn in Ihrer Konfiguration Validierungsfehler vorliegen.
Auflösung
Warten Sie, bis der Cluster und alle zugehörigen Ressourcen den ACTIVE Status erreicht haben, und überprüfen Sie dann Ihre Konfiguration auf Validierungsfehler, bevor Sie die Aktualisierungsanforderung erneut einreichen.
Validierungsfehler
Häufige Ursache
Der Befehl kehrt sofort mit einem HTTP-Fehler der Stufe 400 und einer beschreibenden Meldung zurück. Dies ist auf ungültige Clusterstatus-, Ressourcenstatus- oder Konfigurationsparameter zurückzuführen.
Auflösung
Beheben Sie den spezifischen Validierungsfehler, der in der Antwort erwähnt wurde, und wiederholen Sie den Aktualisierungsvorgang.