Memecahkan masalah pengaturan Slurm kustom di PCS AWS - AWS PCS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memecahkan masalah pengaturan Slurm kustom di PCS AWS

Jika Anda mengalami kesalahan saat membuat atau memperbarui sumber daya AWS PCS dengan pengaturan kustom Slurm, Anda dapat menggunakan logging untuk mendiagnosis dan menyelesaikan masalah.

Memecahkan masalah pengaturan kustom Slurm yang tidak kompatibel

Masalah: Anda menerima pesan galat yang mirip dengan berikut ini saat melakukan operasi cluster, grup node komputasi, atau antrian:

{OPERATION} failed. The Slurm custom settings of the cluster might be incompatible. Check the settings and try again.

Kesalahan ini dapat terjadi dengan operasi berikut:

  • CreateCluster

  • CreateComputeNodeGroup

  • UpdateComputeNodeGroup

  • CreateQueue

  • UpdateQueue

Solusi: Aktifkan pencatatan untuk memahami masalah spesifik dan memecahkan masalah pengaturan yang tidak kompatibel.

Untuk memecahkan masalah pengaturan kustom Slurm yang tidak kompatibel
  1. Buat klaster jika belum ada, atau pastikan klaster Anda yang ada dalam keadaan di mana logging dapat diaktifkan.

  2. Aktifkan pencatatan untuk klaster Anda. Untuk petunjuk mendetail, lihat Pencatatan dan pemantauan untuk AWS PCS.

    catatan

    Logging dapat diaktifkan setelah cluster dalam pembuatan.

  3. Tinjau log untuk mengidentifikasi masalah konfigurasi Slurm tertentu yang menyebabkan ketidakcocokan.

  4. Perbaiki pengaturan kustom yang tidak kompatibel berdasarkan informasi log dan coba lagi operasi.

Untuk informasi tentang setelan kustom Slurm yang didukung, lihat: