Menggunakan Blok EC2 Kapasitas Amazon untuk ML dengan AWS PCS - AWS PCS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan Blok EC2 Kapasitas Amazon untuk ML dengan AWS PCS

Amazon EC2 Capacity Blocks for MLadalah opsi EC2 pembelian Amazon yang memungkinkan Anda membayar di muka untuk memesan instans komputasi akselerasi berbasis GPU dalam rentang tanggal dan waktu tertentu untuk mendukung beban kerja berdurasi pendek. Instans yang berjalan di dalam Blok Kapasitas secara otomatis ditempatkan berdekatan di dalam Amazon EC2 UltraClusters, untuk jaringan latensi rendah, skala petabit, dan non-pemblokiran. Untuk informasi selengkapnya, lihat Blok Kapasitas untuk ML di Panduan Pengguna Amazon Elastic Compute Cloud.

Anda dapat menggunakan template peluncuran agar AWS PCS menggunakan Blok Kapasitas saat meluncurkan instance untuk grup node komputasi.

catatan

AWS PCS memperkenalkan dukungan untuk Blok Kapasitas sejak Slurm versi 24.05.

Batasan

  • AWS PCS hanya mendukung Blok Kapasitas dengan keluarga instans P5en, P5e, P5, dan P4d.

  • Anda hanya dapat mengaitkan grup node komputasi dengan 1 Blok Kapasitas pada satu waktu.

  • Anda tidak dapat mengaitkan grup node komputasi dengan grup reservasi kapasitas yang menggabungkan beberapa Blok Kapasitas.

  • Blok Kapasitas harus dalam active keadaan scheduled atau untuk digunakan dengan AWS PCS. Anda tidak dapat menggunakan Blok Kapasitas di negara bagian lain, sepertipayment-failed. Untuk informasi selengkapnya, lihat Melihat Blok Kapasitas di Panduan Pengguna Amazon Elastic Compute Cloud.

Kedaluwarsa Blok Kapasitas

Blok Kapasitas terbatas pada tanggal dan rentang waktu tertentu. Saat Blok Kapasitas kedaluwarsa:

  • Grup node komputasi yang terkait dengan Blok Kapasitas itu terus ada dan tetap terkait dengan antrian yang sama.

  • Semua instance dalam grup node komputasi dihentikan dan pekerjaan aktif mungkin gagal, berdasarkan pengaturan Slurm Anda.

  • AWS PCS tidak dapat meluncurkan instance baru di grup node komputasi.

  • Semua pekerjaan antrian atau yang baru dikirimkan tetap dalam status tertunda hingga grup node komputasi lain dilampirkan ke antrian atau Anda memperbarui grup node komputasi untuk menggunakan templat peluncuran baru yang menentukan Blok Kapasitas baru.