Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Memecahkan masalah reboot Slurm di PCS AWS
Saat Anda mengalami masalah reboot node, periksa dulu status node menggunakanscontrol
show node . Kemudian periksa CloudWatch log untuk Slurm (slurmctld dan slurmd) dan log sistem untuk mengidentifikasi potensi kesalahan.nodename
Untuk pemecahan masalah dasar, verifikasi konektivitas jaringan, periksa pengaturan grup keamanan, dan pastikan semua layanan yang diperlukan berjalan setelah reboot. Jika masalah berlanjut setelah langkah pemecahan masalah dasar, hubungi Support. AWS Saat menjangkau dukungan, berikan kutipan log yang relevan, informasi status node, dan garis waktu upaya reboot untuk membantu mempercepat proses resolusi.
Sumber daya tambahan
-
Untuk memantau instans AWS PCS yang menggunakan CloudWatch, lihat Memantau instans AWS PCS menggunakan Amazon. CloudWatch
-
Untuk pemecahan masalah umum, lihat. Memecahkan masalah di Layanan Komputasi AWS Paralel
-
Untuk dokumentasi Slurm, lihat Panduan Pemecahan Masalah Slurm
.