Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Häufig gestellte Fragen zu Slurm-Versionen in AWS PCS
AWS PCS unterstützt weiterhin mehrere Slurm-Versionen. Wenn eine neue Slurm-Version eingeführt wird, bietet AWS PCS technischen Support und Sicherheitspatches, bis diese Version das Ende des Supports (EOS) von SchedMD erreicht. AWS PCS bezeichnet das EOS-Datum für eine Slurm-Version aus terminologischen Gründen als End of Life (EOL). AWS
Wie lange unterstützt AWS PCS eine Slurm-Version?
AWS Die PCS-Unterstützung für Slurm-Versionen entspricht den Supportzyklen von SchedMD für Hauptversionen. AWS PCS unterstützt die aktuelle Version und die beiden neuesten vorherigen Hauptversionen. Wenn SchedMD eine neue Hauptversion veröffentlicht, beendet AWS PCS die Unterstützung für die älteste unterstützte Version. AWS PCS veröffentlicht neue Hauptversionen von Slurm so schnell wie möglich, aber es kann zu Verzögerungen zwischen der Veröffentlichung von SchedMD und ihrer Verfügbarkeit in PCS kommen. AWS
Wie erhalten meine Cluster neue Slurm-Patch-Versionen?
Um Fehler zu beheben und Sicherheitsfixes zu beheben, ist AWS PCS so konzipiert, dass Patches automatisch auf Cluster-Controllern installiert werden, die unter internen Dienstkonten ausgeführt werden. Um Patches auf Ihren EC2 Instances zu installieren AWS-Konto, aktualisieren Sie das Amazon Machine Image (AMI) für Ihre Compute-Knotengruppen und aktualisieren Sie die Compute-Knotengruppen, sodass sie das aktualisierte AMI verwenden. Weitere Informationen finden Sie unter Benutzerdefinierte Amazon Machine Images (AMIs) für AWS PCS.
Anmerkung
Slurm-Controller sind nicht verfügbar, solange wir sie aktualisieren. Laufende Jobs sind nicht betroffen. Jobs, die eingereicht wurden, bevor der Controller des Clusters nicht mehr verfügbar war, werden zurückgehalten, bis der Controller verfügbar ist.
Wie werde ich über ein bevorstehendes EOL-Event für die Slurm-Version informiert?
Wir senden Ihnen 6 Monate vor dem EOL-Datum eine E-Mail-Nachricht. Wir senden Ihnen jeden Monat vor dem EOL-Datum eine E-Mail-Nachricht mit einer letzten E-Mail-Nachricht 1 Woche vor dem EOL-Datum. Nach dem EOL-Datum senden wir 12 Monate lang monatliche E-Mail-Nachrichten an Kunden, die AWS PCS-Cluster mit EOL-Slurm-Versionen betreiben. Wir können einen Cluster mit einer EOL-Slurm-Version aussetzen, wenn für diese Version Sicherheitslücken festgestellt werden.
Wie kann ich feststellen, ob auf der von meinem Cluster verwendeten Slurm-Version eine EOL-Slurm-Version ausgeführt wird?
Wir senden Ihnen eine E-Mail-Nachricht, um Sie darüber zu informieren, dass Sie einen laufenden Cluster mit einer EOL-Slurm-Version haben. Wir senden eine Warnung zu den AWS Health Dashboard Alerts, die die Details Ihrer Cluster mit EOL-Slurm-Versionen enthält. Sie können auch die AWS PCS-Konsole verwenden, um die Cluster mit EOL-Slurm-Versionen zu identifizieren.
Was muss ich tun, wenn meine Slurm-Version kurz vor oder nach EOL liegt?
Erstellen Sie einen neuen Cluster mit einer neueren unterstützten Version von Slurm und aktualisieren Sie die Slurm-Version in Ihrer Compute-Knotengruppe. AMIs Die Slurm-Version in Ihren AMIs und laufenden EC2 Instances darf nicht mehr als 2 Versionen hinter der Slurm-Version des Clusters liegen. Weitere Informationen finden Sie unter Benutzerdefinierte Amazon Machine Images (AMIs) für AWS PCS.
Was passiert, wenn ich bis zum EOL-Datum nicht zu einer neueren Version von Slurm wechsle?
Mit einer EOL-Slurm-Version können Sie keine neuen Cluster erstellen. Bestehende Cluster können bis zu 12 Monate ohne AWS Support betrieben werden, und es sind keine sofortigen Maßnahmen erforderlich, um ihren Betrieb aufrechtzuerhalten. Nach dem EOL-Datum können Support, Sicherheitsupdates und Verfügbarkeit nicht garantiert werden. Wir können einen Cluster aus Sicherheitsgründen aussetzen. Wir empfehlen Ihnen dringend, eine unterstützte Slurm-Version zu verwenden, um die Sicherheit und den Support für Ihre AWS PCS-Cluster zu gewährleisten.
Was sind die Risiken beim Betrieb eines Clusters mit EOL-Slurm-Versionen?
Cluster mit EOL-Slurm-Versionen bergen erhebliche Sicherheits- und Betriebsrisiken. Ohne die aktive Überwachung durch SchedMD könnten Sicherheitslücken unentdeckt bleiben oder nicht behoben werden. Wenn kritische Sicherheitslücken entdeckt werden, können wir Ihre Cluster sofort sperren.
Was passiert mit meinen Jobs, Cluster-Rechen-, Speicher- und Netzwerkressourcen, wenn mein Cluster gesperrt wird?
Alle von AWS PCS verwalteten Ressourcen werden beendet. Dazu gehören der Slurm-Controller, Compute-Knotengruppen und EC2 Instanzen. Alle Jobs, die auf Recheninstanzen ausgeführt werden, werden sofort beendet und der Cluster wechselt in einen angehaltenen Zustand. Vom Kunden verwaltete Ressourcen, wie z. B. externe Dateisysteme, bleiben intakt. Sie können die AWS PCS-Konsole und API-Aktionen verwenden, um auf die Konfiguration des Clusters zuzugreifen.
Kann ich einen angehaltenen Cluster neu starten, um die verbleibenden Jobs wieder aufzunehmen?
Nein, Sie können einen unterbrochenen Cluster nicht neu starten. Sie können die Konfiguration Ihres suspendierten Clusters verwenden, um einen neuen Cluster mit einer unterstützten Slurm-Version zu erstellen. Sie können Ihre verbleibenden Jobs ausführen, wenn Sie sie in einem externen Dateisystem gespeichert haben.
Kann ich eine Verlängerung über die 12-monatige Nachfrist hinaus beantragen?
Nein, Sie können keine Verlängerung für den Betrieb Ihres Clusters nach Ablauf der 12-monatigen Kulanzzeit beantragen. Wir bieten die verlängerte Frist, um Ihnen bei der Umstellung auf eine unterstützte Slurm-Version zu helfen. Um Störungen Ihres Clusterbetriebs zu vermeiden, empfehlen wir Ihnen, zu wechseln, bevor Ihre Slurm-Version EOL erreicht.