View a markdown version of this page

Metrik slurm dalam PCS AWS - AWS PCS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Metrik slurm dalam PCS AWS

AWS PCS mendukung fitur metrik Slurm, yang mengekspos data cluster real-time melalui titik akhir HTTP yang kompatibel dengan Prometheus dan sistem pemantauan lainnya. Untuk detailnya, termasuk dampak kinerja dan pertimbangan keamanan, lihat Panduan Metrik dalam dokumentasi Slurm.

Prasyarat

Sebelum mengaktifkan metrik Slurm, pastikan Anda memiliki:

  • Versi cluster: Slurm versi 25.11 atau lebih tinggi.

  • Grup keamanan: Aturan yang memungkinkan lalu lintas HTTP pada port 6817 dari sumber yang Anda inginkan.

Aktifkan titik akhir metrik

Atur pengaturan Slurm kustom tingkat cluster berikut:

  • MetricsType— Harus menentukan plugin metrik yang didukung, sepertimetrics/openmetrics.

  • CommunicationParameters- Harus termasukenable_http.

    penting

    Mengaktifkan enable_http mengekspos titik akhir HTTP yang tidak diautentikasi. Siapa pun yang memiliki akses jaringan ke port 6817 dapat membaca metrik cluster, job, dan node. Gunakan aturan grup keamanan untuk membatasi akses ke sumber tepercaya saja.

  • PrivateData- Tidak harus diatur.

Untuk informasi tambahan tentang pengaturan Slurm kustom, lihat. Mengkonfigurasi pengaturan Slurm kustom di PCS AWS

Gunakan titik akhir metrik

Kueri titik akhir metrik dari host dengan akses jaringan ke pengontrol:

curl http://controller-ip:6817/metrics

Untuk informasi tambahan tentang metrik yang tersedia dan konfigurasi pengikisan, lihat Panduan Metrik dalam dokumentasi Slurm.