Luncurkan instans dengan Blok Kapasitas (CB) - AWS ParallelCluster

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Luncurkan instans dengan Blok Kapasitas (CB)

AWS ParallelCluster mendukung Pemesanan Kapasitas Sesuai Permintaan (ODCR) dan Blok Kapasitas (CB) untuk Machine Learning. Tidak seperti ODCR, CB dapat memiliki waktu mulai masa depan dan terikat waktu. Untuk informasi selengkapnya tentang peluncuran dengan ODCR, lihat Meluncurkan instans dengan Pemesanan Kapasitas Sesuai Permintaan (ODCR).

Menggunakan CB dengan AWS ParallelCluster

Untuk mengonfigurasi cluster baru atau yang sudah ada untuk menggunakan CB, pertama-tama Anda harus memiliki CB yang valid di akun Anda. AWS Anda dapat menggunakan Konsol Manajemen AWS, AWS Command Line Interface, atau SDK untuk menemukan dan membeli CB yang tersedia dengan mengikuti dokumentasi resmi. Setelah Anda memiliki CB yang valid, Anda dapat mengatur CB Amazon Resource Name (ARN) dan parameter terkait dalam file konfigurasi Anda. AWS ParallelCluster Untuk informasi selengkapnya, lihat Temukan dan beli Blok Kapasitas (CB)

CB dalam konfigurasi cluster

Untuk menggunakan CB untuk antrian tertentu Anda harus menggunakan parameter. CapacityReservationId Konfigurasikan ke ID CB yang ada. Anda dapat memperoleh CB ARN dari Konsol Manajemen AWS AWS CLI,, atau SDK yang Anda gunakan untuk membuat CB.

Anda harus mengatur CapacityType = CAPACITY_BLOCK antrian di mana Anda ingin menggunakan CB. Setel ke sumber daya komputasi (sama dengan jenis instans Amazon Elastic Compute Cloud dari CB). InstanceType

Saat Anda menentukan CapacityReservationId di tingkat sumber daya komputasi, opsional InstanceType karena akan diambil secara otomatis dari reservasi.

Bila Anda menggunakanCapacityType = CAPACITY_BLOCK, MaxCount harus sama dengan MinCount dan lebih besar dari 0, karena semua instance yang merupakan bagian dari reservasi CB dikelola sebagai node statis.

Pada waktu pembuatan cluster, head node menunggu semua node statis siap sebelum menandakan keberhasilan pembuatan cluster. Namun, saat Anda menggunakanCapacityType = CAPACITY_BLOCK, node yang merupakan bagian dari sumber daya komputasi yang terkait dengan tidak akan dipertimbangkan untuk pemeriksaan ini. Cluster akan dibuat bahkan jika semua yang dikonfigurasi tidak aktif.

Cuplikan file konfigurasi berikut menunjukkan parameter yang diperlukan untuk mengaktifkan dalam file AWS ParallelCluster konfigurasi.

SlurmQueues: - Name: string CapacityType: CAPACITY_BLOCK ComputeResources: - Name: string InstanceType: String (EC2 Instance type of the CB) MinCount: integer (<= total capacity of the CB) MaxCount: integer (equal to MinCount) CapacityReservationTarget: CapacityReservationId: String (CB id)

Cara AWS ParallelCluster menggunakan Blok Kapasitas (CB)

AWS ParallelCluster mengelola node statis yang terkait dengan cara yang aneh. AWS ParallelCluster membuat cluster bahkan jika CB belum aktif, dan instance diluncurkan secara otomatis setelah CB aktif.

SlurmNode yang sesuai dengan sumber daya komputasi, terkait dengan, dan belum aktif, disimpan dalam pemeliharaan sampai mencapai waktu mulai CB. Slurmnode tetap dalam reservation/maintenance keadaan dan dikaitkan dengan pengguna admin slurm. Ini berarti mereka dapat menerima pekerjaan, tetapi pekerjaan tetap pending sampai reservasi dihapus.

AWS ParallelCluster secara otomatis memperbarui Slurm reservasi dan menempatkan node CB terkait dalam status pemeliharaan (sesuai dengan status CB). Ketika CB aktif, Slurm reservasi dihapus, dan node mulai dan tersedia untuk pekerjaan yang tertunda atau untuk pengiriman pekerjaan baru.

Ketika waktu akhir CB tercapai, node akan dipindahkan kembali ke reservation/maintenance keadaan. Terserah pengguna untuk pekerjaan resubmit/requeue ke antrian/sumber daya komputasi baru ketika CB tidak lagi aktif dan instance dihentikan.