Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Catatan rilis untuk versi Slurm di PCS AWS
Topik ini menjelaskan perubahan penting untuk setiap versi Slurm yang saat ini didukung di AWS PCS. Kami sarankan Anda meninjau perubahan antara versi lama dan baru saat Anda meng-upgrade klaster Anda.
Perubahan diterapkan di AWS PCS
-
Slurm SchedulerParameter requeue_on_resume_failure sekarang Diaktifkan secara default.
-
“stderr” telah dihapus sebagai opsi untuk LogTimeFormat, karena dinonaktifkan di Slurm 25.05.
-
AWS PCS mendukung konfigurasi sackd multi-cluster: node login dapat mengakses beberapa cluster.
Untuk informasi lebih lanjut tentang Slurm 25.05, lihat publikasi berikut:
Perubahan diterapkan di AWS PCS
-
AWS PCS mendukung akuntansi Slurm. Untuk informasi selengkapnya, lihat Akuntansi slurm di PCS AWS.
Untuk informasi lebih lanjut tentang Slurm 24.11, lihat publikasi berikut:
Perubahan diterapkan di AWS PCS
-
Modul Slurm Step Manager baru sekarang diaktifkan secara default di AWS PCS. Modul ini memberikan manfaat yang signifikan dengan membongkar manajemen langkah dari pengontrol pusat ke node komputasi, secara substansional meningkatkan konkurensi sistem di lingkungan dengan penggunaan langkah berat. Untuk mendukung konfigurasi ini dan mengisolasi
PrologdanEpilogmemproses eksekusi yang lebih baik, flag prolog baru (Contain,Alloc) diaktifkan. -
Komunikasi hierarkis dari pengontrol ke node komputasi diaktifkan untuk mengoptimalkan komunikasi intra-node Slurm, yang meningkatkan skalabilitas dan kinerja. Selain itu, konfigurasi routing sekarang menggunakan daftar node partisi untuk komunikasi dari controller, bukan algoritma routing default plugin, meningkatkan ketahanan sistem.
-
Plugin hash baru
HashPlugin=hash/sha3menggantikan yang sebelumnya.hash/k12 pluginIni sekarang diaktifkan secara default di cluster AWS PCS. -
Log pengontrol slurm sekarang menyertakan kemampuan audit yang ditingkatkan untuk semua panggilan prosedur jarak jauh masuk (RPC) ke.
slurmctldLog termasuk alamat sumber, pengguna yang diautentikasi, dan jenis RPC sebelum pemrosesan koneksi.
Untuk informasi lebih lanjut tentang Slurm 24.05, lihat publikasi berikut:
Pengaturan slurm yang dapat Anda ubah di PCS AWS
-
SuspendTimeDefault ke.60Gunakan parameterscaleDownIdleTimeInSecondskonfigurasi AWS PCS untuk mengaturnya. Untuk informasi selengkapnya, lihatscaleDownIdleTimeInSecondsparameter tipeClusterSlurmConfigurationdata di Referensi AWS PCS API. -
MaxJobCountDanMaxArraySizedidasarkan pada ukuran yang Anda pilih untuk cluster. Untuk informasi selengkapnya, lihatsizeparameter aksiCreateClusterAPI di Referensi AWS PCS API. -
Pengaturan
SelectTypeParametersSlurm default ke.CR_CPUAnda dapat memberikannya sebagai nilai untukslurmCustomSettingsmengaturnya saat Anda membuat cluster. Untuk informasi selengkapnya, lihatslurmCustomSettingsparameter aksiCreateClusterAPI dan SlurmCustomSettingReferensi AWS PCS API. -
Anda dapat mengatur
PrologdanEpilogpada tingkat cluster. Anda dapat memberikannya sebagai nilai untukslurmCustomSettingsmengaturnya saat Anda membuat cluster. Untuk informasi selengkapnya, lihatCreateClusterdan SlurmCustomSettingdi Referensi AWS PCS API. -
Anda dapat mengatur
WeightdanRealMemorypada tingkat grup node komputasi. Anda dapat memberikannya sebagai nilaislurmCustomSettingsuntuk mengaturnya saat Anda membuat grup node komputasi. Untuk informasi selengkapnya, lihatCreateComputeNodeGroupdan SlurmCustomSettingdi Referensi AWS PCS API.