Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Instans EC2 di AWS PCS dihentikan dan diganti setelah reboot
Ikhtisar masalah
Setelah instance EC2 dalam grup node komputasi di-boot ulang, AWS PCS secara otomatis mengakhiri dan menggantikan instance.
Mengapa ini terjadi
AWS PCS tidak mendukung reboot instance. Jika instans EC2 di-boot ulang, AWS PCS menganggap instance tidak sehat dan menggantikannya. Jika AWS PCS terus-menerus menghentikan dan mengganti instance Anda, itu mungkin karena sesuatu me-reboot instance Anda setelah diluncurkan. Beberapa contoh termasuk reboot dengan otomatisasi pada instans EC2 (seperti reboot otomatis setelah patch), otomatisasi eksternal untuk instans EC2 (seperti aplikasi manajemen jaringan), AWS layanan lain (seperti AWS Systems Manager), atau reboot manual oleh seseorang.
Apa yang harus dilakukan
Anda dapat memeriksa slurmctld atau slurmd log Anda untuk melihat apakah instance Anda di-boot ulang. Untuk informasi selengkapnya, lihat Log penjadwal di AWS PCS dan Memantau instans AWS PCS menggunakan Amazon CloudWatch. Contoh entri slurmctld log berikut menunjukkan bahwa instance reboot:
contoh
[2024-09-12T06:42:50.393+00:00] validate_node_specs: Node Login-1 unexpectedly rebooted boot_time=1726123354 last response=1726123285Mem-boot ulang karena menambal
Reboot sering diperlukan setelah Anda menerapkan tambalan. Jangan menerapkan patch langsung ke instance EC2 yang merupakan bagian dari grup node komputasi AWS PCS. Jika Anda harus menambal instans EC2, Anda harus menerapkan tambalan ke Amazon Machine Image (AMI) yang diperbarui dan memperbarui grup node komputasi Anda untuk menggunakan AMI yang diperbarui. Instans EC2 baru yang diluncurkan AWS PCS untuk grup node komputasi tersebut akan menggunakan AMI yang diperbarui (ditambal). Untuk informasi selengkapnya, lihat Gambar Mesin Amazon Kustom (AMIs) untuk AWS PCS.