Eine EC2-Instanz in AWS PCS wird nach dem Neustart beendet und ersetzt - AWS PCS

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Eine EC2-Instanz in AWS PCS wird nach dem Neustart beendet und ersetzt

Überblick über das Problem

Nach dem Neustart einer EC2-Instance in einer Compute-Knotengruppe beendet AWS PCS die Instanz automatisch und ersetzt sie.

Warum passiert das

AWS PCS unterstützt keine Instanzneustarts. Wenn eine EC2-Instance neu gestartet wird, betrachtet AWS PCS die Instance als fehlerhaft und ersetzt sie. Wenn AWS PCS Ihre Instances kontinuierlich beendet und ersetzt, kann das daran liegen, dass Ihre Instances nach dem Start neu gestartet werden. Einige Beispiele hierfür sind automatische Neustarts auf der EC2-Instance (z. B. ein automatischer Neustart nach dem Patchen), Automatisierung außerhalb der EC2-Instance (z. B. eine Netzwerkverwaltungsanwendung), ein anderer AWS Dienst (z. B. AWS Systems Manager) oder ein manueller Neustart durch eine Person.

Vorgehensweise

Sie können in Ihren slurmctld slurmd OP-Protokollen nachsehen, ob Ihre Instance neu gestartet wurde. Weitere Informationen erhalten Sie unter Der Scheduler protokolliert in AWS PCS und Überwachung von AWS PCS-Instances mithilfe von Amazon CloudWatch. Der folgende slurmctld Beispielprotokolleintrag gibt an, dass die Instanz neu gestartet wurde:

Beispiel
[2024-09-12T06:42:50.393+00:00] validate_node_specs: Node Login-1 unexpectedly rebooted boot_time=1726123354 last response=1726123285
Neustart aufgrund von Patches

Nach der Installation von Patches ist häufig ein Neustart erforderlich. Wenden Sie Patches nicht direkt auf eine EC2-Instance an, die Teil einer AWS PCS-Rechenknotengruppe ist. Wenn Sie Ihre EC2-Instances patchen müssen, sollten Sie Ihre Patches auf ein aktualisiertes Amazon Machine Image (AMI) anwenden und Ihre Rechenknotengruppen aktualisieren, um das aktualisierte AMI zu verwenden. Neue EC2-Instances, die AWS PCS für diese Rechenknotengruppen startet, verwenden das aktualisierte (gepatchte) AMI. Weitere Informationen finden Sie unter Benutzerdefinierte Amazon Machine Images (AMIs) für AWS PCS.