Membuat cluster di Layanan Komputasi AWS Paralel - AWS PCS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat cluster di Layanan Komputasi AWS Paralel

Topik ini memberikan ikhtisar opsi yang tersedia dan menjelaskan apa yang harus dipertimbangkan saat Anda membuat klaster di AWS Parallel Computing Service (AWS PCS). Jika ini adalah pertama kalinya Anda membuat cluster AWS PCS, kami sarankan Anda mengikutiMemulai Layanan Komputasi AWS Paralel. Tutorial ini dapat membantu Anda membuat sistem HPC yang berfungsi tanpa memperluas ke semua opsi yang tersedia dan arsitektur sistem yang dimungkinkan.

Prasyarat

Buat cluster AWS PCS

Anda dapat menggunakan AWS Management Console atau AWS CLI untuk membuat cluster.

AWS Management Console
Untuk membuat klaster DB
  1. Buka konsol AWS PCS di https://console.aws.amazon.com/pcs/rumah #/cluster dan pilih Buat cluster.

  2. Di bagian Pengaturan cluster, masukkan bidang berikut:

    • Nama cluster — Nama untuk cluster Anda. Nama hanya dapat berisi karakter alfanumerik (peka huruf besar/kecil) dan tanda hubung. Itu harus dimulai dengan karakter alfabet dan tidak boleh lebih dari 40 karakter. Nama harus unik di dalam Wilayah AWS dan Akun AWS tempat Anda membuat cluster.

    • Scheduler — Pilih penjadwal dan versi. Untuk informasi selengkapnya, lihat Versi slurm di PCS AWS.

    • Ukuran pengontrol - Pilih ukuran untuk pengontrol Anda. Ini menentukan berapa banyak pekerjaan bersamaan dan node komputasi yang dapat dikelola oleh cluster AWS PCS. Anda hanya dapat mengatur ukuran pengontrol saat cluster dibuat. Untuk informasi lebih lanjut tentang ukuran, lihatUkuran cluster dalam AWS PCS.

  3. Di bagian Jaringan, pilih nilai untuk bidang berikut:

    • Jenis jaringan — Pilih jenis alamat IP untuk cluster Anda. Cluster Anda dapat menggunakan salah satu IPv4 atau IPv6, tetapi tidak keduanya. VPC dan subnet harus menggunakan jenis alamat jaringan yang sama. Blok alamat IP yang Anda gunakan untuk setiap subnet harus memiliki setidaknya 1 alamat yang tersedia. AWS menyimpan beberapa alamat di setiap subnet. Untuk informasi selengkapnya, lihat Blok CIDR Subnet di Panduan Pengguna Amazon VPC.

    • VPC — Pilih VPC yang sudah ada yang memenuhi persyaratan PCS. AWS Untuk informasi selengkapnya, lihat AWS PCS VPC dan persyaratan subnet dan pertimbangan. Setelah Anda membuat cluster, Anda tidak dapat mengubah VPC-nya. Jika tidak VPCs terdaftar, Anda harus membuatnya terlebih dahulu.

    • Subnet - Semua subnet yang tersedia di VPC yang dipilih terdaftar. Pilih subnet yang memenuhi persyaratan subnet AWS PCS. Untuk informasi selengkapnya, lihat AWS PCS VPC dan persyaratan subnet dan pertimbangan. Kami menyarankan Anda memilih subnet pribadi untuk menghindari mengekspos endpoint scheduler Anda ke internet publik.

    • Grup keamanan — Tentukan grup keamanan yang Anda ingin AWS PCS kaitkan dengan antarmuka jaringan yang dibuatnya untuk klaster Anda. Anda harus memilih setidaknya satu grup keamanan yang memungkinkan komunikasi antara cluster Anda dan node komputasinya. Anda dapat memilih Cepat membuat grup keamanan agar AWS PCS membuatnya dengan konfigurasi yang diperlukan di VPC yang Anda pilih, atau pilih grup keamanan yang ada. Untuk informasi selengkapnya, lihat Persyaratan dan pertimbangan kelompok keamanan.

  4. (Opsional) Di bagian konfigurasi akuntansi Slurm, Anda dapat mengaktifkan akuntansi Slurm dan mengatur parameter akuntansi. Untuk informasi selengkapnya, lihat Akuntansi slurm di PCS AWS.

  5. (Opsional) Di bagian konfigurasi Slurm, Anda dapat menentukan opsi konfigurasi Slurm yang mengganti default yang ditetapkan oleh PCS: AWS

    • Turunkan waktu idle — Ini mengontrol berapa lama node komputasi yang disediakan secara dinamis tetap aktif setelah pekerjaan yang ditempatkan pada mereka selesai atau dihentikan. Menyetel ini ke nilai yang lebih panjang dapat membuatnya lebih mungkin bahwa pekerjaan berikutnya dapat berjalan di node, tetapi dapat menyebabkan peningkatan biaya. Nilai yang lebih pendek akan mengurangi biaya, tetapi dapat meningkatkan proporsi waktu yang dihabiskan sistem HPC Anda untuk menyediakan node dibandingkan dengan menjalankan pekerjaan pada mereka.

    • Prolog — Ini adalah jalur yang sepenuhnya memenuhi syarat ke direktori skrip prolog pada instance grup node komputasi Anda. Ini sesuai dengan pengaturan Prolog di Slurm. Perhatikan bahwa ini harus berupa direktori, bukan jalur ke executable tertentu.

    • Epilog — Ini adalah jalur yang sepenuhnya memenuhi syarat ke direktori skrip epilog pada instance grup node komputasi Anda. Ini sesuai dengan pengaturan Epilog di Slurm. Perhatikan bahwa ini harus berupa direktori, bukan jalur ke executable tertentu.

    • Pilih parameter tipe — Ini membantu mengontrol algoritma pemilihan sumber daya yang digunakan oleh Slurm. Menyetel nilai ini CR_CPU_Memory akan mengaktifkan penjadwalan sadar memori, sementara menyetelnya CR_CPU akan mengaktifkan penjadwalan khusus CPU. Parameter ini sesuai dengan SelectTypeParameterspengaturan di Slurm di mana SelectType diatur select/cons_tres oleh AWS PCS.

  6. (Opsional) Di bawah Tag, tambahkan tag apa pun ke cluster AWS PCS Anda.

  7. Pilih Buat klaster. Bidang Status ditampilkan Creating saat AWS PCS membuat cluster. Proses ini dapat memakan waktu beberapa menit.

penting

Hanya ada 1 cluster dalam satu Creating keadaan per Wilayah AWS per Akun AWS. AWS PCS mengembalikan kesalahan jika sudah ada cluster dalam Creating keadaan ketika Anda mencoba membuat cluster.

AWS CLI
Untuk membuat klaster DB
  1. Buat cluster Anda dengan perintah berikut. Sebelum menjalankan perintah, buat penggantian berikut:

    • Ganti region dengan ID tempat Wilayah AWS Anda ingin membuat cluster Anda, sepertius-east-1.

    • Ganti my-cluster dengan nama untuk cluster Anda. Nama hanya dapat berisi karakter alfanumerik (peka huruf besar/kecil) dan tanda hubung. Itu harus dimulai dengan karakter alfabet dan tidak boleh lebih dari 40 karakter. Nama harus unik di dalam Wilayah AWS dan Akun AWS di mana Anda membuat cluster.

    • Ganti 24.11 dengan versi Slurm yang didukung.

      catatan

      AWS PCS saat ini mendukung Slurm 24.11 dan 24.05.

    • Ganti SMALL dengan ukuran cluster yang didukung. Ini menentukan berapa banyak pekerjaan bersamaan dan node komputasi yang dapat dikelola oleh cluster AWS PCS. Itu hanya dapat diatur ketika cluster dibuat. Untuk informasi lebih lanjut tentang ukuran, lihatUkuran cluster dalam AWS PCS.

    • Ganti nilainya subnetIds dengan milik Anda sendiri. Kami menyarankan Anda memilih subnet pribadi untuk menghindari mengekspos endpoint scheduler Anda ke internet publik.

    • Tentukan securityGroupIds yang Anda ingin AWS PCS kaitkan dengan antarmuka jaringan yang dibuatnya untuk cluster Anda. Grup keamanan harus berada di VPC yang sama dengan cluster. Anda harus memilih setidaknya satu grup keamanan yang memungkinkan komunikasi antara cluster Anda dan node komputasinya. Untuk informasi selengkapnya, lihat Persyaratan dan pertimbangan kelompok keamanan.

    • Secara opsional, Anda dapat memberikan kunci KMS khusus untuk mengenkripsi data pengontrol Anda menggunakan. --kms-key-id kms-key Ganti kms-key dengan ARN KMS, ID kunci, atau alias yang ada. Perhatikan bahwa akun yang digunakan untuk membuat cluster harus memiliki kms:Decrypt hak istimewa pada kunci KMS kustom.

    aws pcs create-cluster --region region \ --cluster-name my-cluster \ --scheduler type=SLURM,version=24.11 \ --size SMALL \ --networking subnetIds=subnet-ExampleId1,securityGroupIds=sg-ExampleId1
    • untuk digunakan IPv6, tambahkan networkType=IPV6 ke --networking konfigurasi.

      --networking networkType=IPV6,subnetIds=subnet-ExampleId1,securityGroupIds=sg-ExampleId1
    • Secara opsional, Anda dapat menambahkan --slurm-configration opsi untuk menyesuaikan perilaku Slurm dan menentukan opsi konfigurasi Slurm. Contoh berikut menetapkan waktu idle scale-down menjadi 60 menit (3600 detik), memungkinkan akuntansi Slurm, dan menentukan slurm.conf pengaturan sebagai nilai untuk. slurmCustomSettings Untuk informasi selengkapnya, lihat Akuntansi slurm di PCS AWS.

      catatan

      Akuntansi didukung untuk Slurm 24.11 atau yang lebih baru.

      aws pcs create-cluster --region region \ --cluster-name my-cluster \ --scheduler type=SLURM,version=24.11 \ --size SMALL \ --networking subnetIds=subnet-ExampleId1,securityGroupIds=sg-ExampleId1 --slurm-configuration scaleDownIdleTimeInSeconds=3600,accounting='{mode=STANDARD}',slurmCustomSettings='[{parameterName=SelectTypeParameters,parameterValue=CR_CPU_Memory}]'
  2. Diperlukan beberapa menit untuk menyediakan cluster. Anda dapat melakukan kueri status klaster Anda dengan perintah berikut. Jangan melanjutkan untuk membuat antrian atau menghitung grup node sampai bidang status klaster berada. ACTIVE

    aws pcs get-cluster --region region --cluster-identifier my-cluster
penting

Hanya ada 1 cluster dalam satu Creating keadaan per Wilayah AWS per Akun AWS. AWS PCS mengembalikan kesalahan jika sudah ada cluster dalam Creating keadaan ketika Anda mencoba membuat cluster.

Langkah selanjutnya yang disarankan untuk klaster Anda
  • Tambahkan grup node komputasi.

  • Tambahkan antrian.

  • Aktifkan logging.