

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Reboot node komputasi menggunakan Slurm di PCS AWS
<a name="slurm-reboot-procedure"></a>

Gunakan perintah reboot asli Slurm untuk menyelesaikan masalah kinerja, menghapus masalah sumber daya, atau memulihkan dari status terdegradasi tanpa kehilangan kapasitas instans EC2.

## Prasyarat
<a name="slurm-reboot-procedure-prerequisites"></a>
+ Hak istimewa Admin Slurm (akses pengguna root)
+ Akses ke node login di cluster AWS PCS

## Prosedur
<a name="slurm-reboot-procedure-steps"></a>

1. Connect ke node login melalui konsol EC2.

   1. Di konsol EC2, pilih **Instans**.

   1. Pilih instance node login Anda.

   1. Pilih **Hubungkan**.

1. Identifikasi nama node komputasi target menggunakan `sinfo` atau`scontrol show node`.

   ```
   sinfo
   # or
   scontrol show node
   ```

1. Jalankan perintah reboot menggunakan salah satu opsi ini:
**Awas**  
Jangan gunakan `nextstate=DOWN` dengan `scontrol reboot` perintah. Parameter ini menandai node sebagai tidak sehat dan memicu penggantian instance.
   + Reboot dasar (menunggu node menjadi idle):

     ```
     scontrol reboot {{nodename}}
     ```
   + Reboot segera (menguras node dan reboot saat pekerjaan selesai):

     ```
     scontrol reboot ASAP {{nodename}}
     ```
   + Reboot dengan alasan:

     ```
     scontrol reboot ASAP reason="troubleshooting" {{nodename}}
     ```
   + Reboot dengan status resume:

     ```
     scontrol reboot ASAP nextstate=RESUME {{nodename}}
     ```

1. Pantau kemajuan reboot menggunakan`scontrol show node`.

   ```
   scontrol show node {{nodename}}
   ```

1. Verifikasi node kembali ke layanan setelah reboot selesai.