View a markdown version of this page

Memecahkan masalah reboot Slurm di PCS AWS - AWS PCS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memecahkan masalah reboot Slurm di PCS AWS

Saat Anda mengalami masalah reboot node, periksa dulu status node menggunakanscontrol show node nodename. Kemudian periksa CloudWatch log untuk Slurm (slurmctld dan slurmd) dan log sistem untuk mengidentifikasi potensi kesalahan.

Untuk pemecahan masalah dasar, verifikasi konektivitas jaringan, periksa pengaturan grup keamanan, dan pastikan semua layanan yang diperlukan berjalan setelah reboot. Jika masalah berlanjut setelah langkah pemecahan masalah dasar, hubungi Support. AWS Saat menjangkau dukungan, berikan kutipan log yang relevan, informasi status node, dan garis waktu upaya reboot untuk membantu mempercepat proses resolusi.

Sumber daya tambahan