Memecahkan masalah Slurm CLI Filter Plugin di PCS AWS - AWS PCS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memecahkan masalah Slurm CLI Filter Plugin di PCS AWS

Gunakan informasi pemecahan masalah ini untuk menyelesaikan masalah Plugin Filter CLI yang umum.

Pengajuan Job segera gagal dengan kesalahan pemuatan plugin

Gejala: Pengguna menerima pesan kesalahan tentang Plugin Filter CLI yang hilang atau gagal saat mengirimkan pekerjaan.

Kemungkinan penyebabnya:

  • Skrip Plugin Filter CLI hilang dari satu atau lebih node

  • Nama file skrip salah (harus persis) cli_filter.lua

  • Skrip disebarkan ke jalur direktori yang salah

  • Script memiliki izin file yang salah

Resolusi:

  • Verifikasi skrip ada /etc/aws/pcs/scheduler/slurm-<version>/cli_filter.lua di semua node login dan komputasi

  • Periksa nama file skrip persis cli_filter.lua

  • Pastikan skrip memiliki izin yang dapat dibaca (644 atau serupa)

  • Uji penerapan skrip pada satu node login sebelum menerapkan ke cluster penuh

Pembuatan cluster gagal dengan kesalahan validasi Plugin Filter CLI

Gejala: Pembuatan cluster gagal dengan kesalahan tentang parameter yang tidak validCliFilterPlugins.

Kemungkinan penyebabnya:

  • Format nilai parameter salah di slurmCustomSettings

  • Kesalahan ketik dalam nama atau nilai parameter

Resolusi:

  • Gunakan nama parameter yang tepat: CliFilterPlugins

  • Gunakan nilai parameter yang tepat: cli_filter/lua

  • Verifikasi sintaks JSON dalam array slurmCustomSettings

Skrip Plugin Filter CLI dijalankan tetapi validasi pekerjaan tidak berfungsi seperti yang diharapkan

Gejala: Pekerjaan berhasil dikirim tetapi logika validasi kustom tidak memicu atau menghasilkan hasil yang tidak terduga.

Kemungkinan penyebabnya:

  • Kesalahan sintaks skrip Lua

  • Pola akses bidang yang salah (menggunakan sintaks Job Submit Plugin alih-alih Plugin Filter CLI)

  • Kesalahan logika dalam kondisi validasi

Resolusi:

  • Tinjau skrip Lua untuk kesalahan sintaks

  • Verifikasi akses lapangan menggunakan options["field_name"] format, bukan job_desc.field_name

  • Tambahkan pernyataan logging ke alur eksekusi skrip debug

  • Uji logika skrip dengan kasus validasi sederhana terlebih dahulu

Penerapan skrip S3 gagal

Gejala: Instans diluncurkan tetapi skrip Plugin Filter CLI tidak diunduh dari S3.

Kemungkinan penyebabnya:

  • Profil instans IAM tidak memiliki izin baca S3

  • Titik akhir VPC S3 tidak dikonfigurasi

  • Bucket S3 atau jalur objek yang salah dalam data pengguna

Resolusi:

  • Verifikasi profil instans IAM memiliki s3:GetObject izin untuk bucket Anda

  • Konfigurasikan titik akhir S3 VPC Gateway untuk akses langsung

  • Periksa nama bucket S3 dan jalur objek di skrip data pengguna

  • Tinjau log data pengguna instance untuk kesalahan unduhan S3