Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Metrik slurm dalam PCS AWS
AWS PCS mendukung fitur metrik Slurm, yang mengekspos data cluster real-time melalui titik akhir HTTP yang kompatibel dengan Prometheus dan sistem pemantauan lainnya. Untuk detailnya, termasuk dampak kinerja dan pertimbangan keamanan, lihat Panduan Metrik
Prasyarat
Sebelum mengaktifkan metrik Slurm, pastikan Anda memiliki:
-
Versi cluster: Slurm versi 25.11 atau lebih tinggi.
-
Grup keamanan: Aturan yang memungkinkan lalu lintas HTTP pada port 6817 dari sumber yang Anda inginkan.
Aktifkan titik akhir metrik
Atur pengaturan Slurm kustom tingkat cluster berikut:
-
MetricsType— Harus menentukan plugin metrik yang didukung, sepertimetrics/openmetrics. -
CommunicationParameters- Harus termasukenable_http.penting
Mengaktifkan
enable_httpmengekspos titik akhir HTTP yang tidak diautentikasi. Siapa pun yang memiliki akses jaringan ke port 6817 dapat membaca metrik cluster, job, dan node. Gunakan aturan grup keamanan untuk membatasi akses ke sumber tepercaya saja. -
PrivateData- Tidak harus diatur.
Untuk informasi tambahan tentang pengaturan Slurm kustom, lihat. Mengkonfigurasi pengaturan Slurm kustom di PCS AWS
Gunakan titik akhir metrik
Kueri titik akhir metrik dari host dengan akses jaringan ke pengontrol:
curl http://controller-ip:6817/metrics
Untuk informasi tambahan tentang metrik yang tersedia dan konfigurasi pengikisan, lihat Panduan Metrik