Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pertanyaan yang sering diajukan tentang versi Slurm di PCS AWS
AWS PCS mempertahankan dukungan untuk beberapa versi Slurm. Ketika versi Slurm baru diperkenalkan, AWS PCS menyediakan dukungan teknis dan patch keamanan hingga versi tersebut mencapai akhir dukungan (EOS) dari SchedMD. AWS PCS mengacu pada tanggal EOS untuk versi Slurm sebagai akhir masa pakai (EOL) agar konsisten dengan terminologi. AWS
Berapa lama AWS PCS mendukung versi Slurm?
AWS Dukungan PCS untuk versi Slurm selaras dengan siklus dukungan SchedMD untuk versi utama. AWS PCS mendukung versi saat ini dan 2 versi utama terbaru sebelumnya. Ketika SchedMD merilis versi utama baru, AWS PCS mengakhiri dukungan untuk versi tertua yang didukung. AWS PCS merilis versi utama baru Slurm sesegera mungkin tetapi mungkin ada penundaan antara rilis SchedMD dan ketersediaannya di PCS. AWS
Bagaimana cara cluster saya mendapatkan rilis versi patch Slurm baru?
Untuk mengatasi bug dan perbaikan keamanan, AWS PCS dirancang untuk secara otomatis menerapkan tambalan ke pengontrol cluster yang berjalan di akun milik layanan internal. Untuk menginstal patch pada EC2 instance di Anda Akun AWS, perbarui Amazon Machine Image (AMI) untuk grup node komputasi Anda dan perbarui grup node komputasi untuk menggunakan AMI yang diperbarui. Untuk informasi selengkapnya, lihat Gambar Mesin Amazon Kustom (AMIs) untuk AWS PCS.
catatan
Pengontrol slurm tidak tersedia saat kami memperbaruinya. Menjalankan pekerjaan tidak terpengaruh. Pekerjaan yang dikirimkan sebelum controller cluster menjadi tidak tersedia ditahan sampai controller tersedia.
Bagaimana saya mendapat informasi tentang acara EOL versi Slurm yang akan datang?
Kami mengirimkan pesan email 6 bulan sebelum tanggal EOL. Kami mengirimi Anda pesan email setiap bulan sebelum EOL, dengan pesan email terakhir 1 minggu sebelum tanggal EOL. Setelah tanggal EOL, kami mengirim pesan email bulanan selama 12 bulan kepada pelanggan yang menjalankan cluster AWS PCS dengan versi EOL Slurm. Kami mungkin menangguhkan cluster dengan versi EOL Slurm jika kerentanan keamanan diidentifikasi untuk versi itu.
Bagaimana saya bisa menentukan apakah versi Slurm yang digunakan oleh cluster saya menjalankan versi EOL Slurm?
Kami mengirimi Anda pesan email untuk memberi tahu Anda bahwa Anda memiliki cluster yang berjalan dengan versi EOL Slurm. Kami memposting peringatan untuk AWS Health Dashboard peringatan yang berisi rincian cluster Anda dengan versi EOL Slurm. Anda juga dapat menggunakan konsol AWS PCS untuk mengidentifikasi cluster dengan versi EOL Slurm.
Apa yang harus saya lakukan jika versi Slurm saya dekat atau di luar EOL?
Buat cluster baru dengan versi Slurm yang didukung lebih baru dan perbarui versi Slurm di grup node komputasi Anda. AMIs Versi Slurm dalam EC2 instans Anda AMIs dan yang sedang berjalan tidak boleh lebih dari 2 versi di belakang versi Slurm cluster. Untuk informasi selengkapnya, lihat Gambar Mesin Amazon Kustom (AMIs) untuk AWS PCS.
Apa yang akan terjadi jika saya tidak beralih ke versi Slurm yang lebih baru pada tanggal EOL?
Anda tidak dapat membuat cluster baru dengan versi EOL Slurm. Cluster yang ada dapat beroperasi hingga 12 bulan tanpa AWS dukungan, dan tidak ada tindakan segera yang diperlukan untuk mempertahankan operasinya. Setelah tanggal EOL, dukungan, pembaruan keamanan, dan ketersediaan tidak dijamin. Kami mungkin menangguhkan cluster untuk alasan keamanan. Kami sangat menyarankan Anda menggunakan versi Slurm yang didukung untuk menjaga keamanan dan dukungan untuk klaster AWS PCS Anda.
Apa risiko mengoperasikan cluster dengan versi EOL Slurm?
Cluster dengan versi EOL Slurm menghadirkan risiko keamanan dan operasional yang signifikan. Tanpa pemantauan aktif SchedMD, kerentanan keamanan mungkin tetap tidak terdeteksi atau tidak ditangani. Jika kerentanan kritis ditemukan, kami mungkin segera menangguhkan klaster Anda.
Apa yang terjadi pada pekerjaan, komputasi klaster, penyimpanan, dan sumber daya jaringan saya ketika klaster saya ditangguhkan?
Semua sumber daya yang dikelola oleh AWS PCS dihentikan. Ini termasuk kontroler Slurm, grup node komputasi, dan instance. EC2 Setiap pekerjaan yang berjalan pada instance komputasi segera dihentikan, dan klaster memasuki status ditangguhkan. Sumber daya yang dikelola pelanggan, seperti sistem file eksternal, tetap utuh. Anda dapat menggunakan konsol AWS PCS dan tindakan API untuk mengakses konfigurasi cluster.
Bisakah saya memulai ulang cluster yang ditangguhkan untuk melanjutkan pekerjaannya yang tersisa?
Tidak, Anda tidak dapat memulai ulang cluster yang ditangguhkan. Anda dapat menggunakan konfigurasi cluster yang ditangguhkan untuk membuat klaster baru dengan versi Slurm yang didukung. Anda dapat menjalankan pekerjaan yang tersisa jika Anda menyimpannya di sistem file eksternal.
Dapatkah saya meminta perpanjangan di luar masa tenggang 12 bulan?
Tidak, Anda tidak dapat meminta ekstensi untuk menjalankan klaster Anda di luar masa tenggang 12 bulan. Kami menyediakan waktu yang diperpanjang untuk membantu Anda beralih ke versi Slurm yang didukung. Untuk menghindari gangguan pada operasi klaster Anda, kami sarankan Anda beralih sebelum versi Slurm Anda mencapai EOL.