Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Membuat cluster di Layanan Komputasi AWS Paralel
Topik ini memberikan ikhtisar opsi yang tersedia dan menjelaskan apa yang harus dipertimbangkan saat Anda membuat klaster di AWS Parallel Computing Service (AWS PCS). Jika ini adalah pertama kalinya Anda membuat cluster AWS PCS, kami sarankan Anda mengikutiMemulai Layanan Komputasi AWS Paralel. Tutorial ini dapat membantu Anda membuat sistem HPC yang berfungsi tanpa memperluas ke semua opsi yang tersedia dan arsitektur sistem yang dimungkinkan.
Prasyarat
-
VPC dan subnet yang sudah ada yang memenuhi persyaratan. AWS Jaringan PCS Sebelum Anda menerapkan klaster untuk penggunaan produksi, kami sarankan Anda memiliki pemahaman menyeluruh tentang persyaratan VPC dan subnet. Untuk membuat VPC dan subnet, lihat. Membuat VPC untuk klaster PCS Anda AWS
-
Prinsipal IAM dengan izin untuk membuat dan mengelola sumber daya AWS PCS. Untuk informasi selengkapnya, lihat Identity and Access Management untuk Layanan Komputasi AWS Paralel.
Buat cluster AWS PCS
Anda dapat menggunakan AWS Management Console atau AWS CLI untuk membuat cluster.
- AWS Management Console
-
Untuk membuat klaster DB
-
Buka konsol AWS PCS di https://console.aws.amazon.com/pcs/rumah #/cluster dan pilih Buat cluster
. -
Di bagian Pengaturan cluster, masukkan bidang berikut:
-
Nama cluster — Nama untuk cluster Anda. Nama hanya dapat berisi karakter alfanumerik (peka huruf besar/kecil) dan tanda hubung. Itu harus dimulai dengan karakter alfabet dan tidak boleh lebih dari 40 karakter. Nama harus unik di dalam Wilayah AWS dan Akun AWS tempat Anda membuat cluster.
-
Scheduler — Pilih penjadwal dan versi. Untuk informasi selengkapnya, lihat Versi slurm di PCS AWS.
-
Ukuran pengontrol - Pilih ukuran untuk pengontrol Anda. Ini menentukan berapa banyak pekerjaan bersamaan dan node komputasi yang dapat dikelola oleh cluster AWS PCS. Anda hanya dapat mengatur ukuran pengontrol saat cluster dibuat. Untuk informasi lebih lanjut tentang ukuran, lihatUkuran cluster dalam AWS PCS.
-
-
Di bagian Jaringan, pilih nilai untuk bidang berikut:
-
Jenis jaringan — Pilih jenis alamat IP untuk cluster Anda. Cluster Anda dapat menggunakan salah satu IPv4 atau IPv6, tetapi tidak keduanya. VPC dan subnet harus menggunakan jenis alamat jaringan yang sama. Blok alamat IP yang Anda gunakan untuk setiap subnet harus memiliki setidaknya 1 alamat yang tersedia. AWS menyimpan beberapa alamat di setiap subnet. Untuk informasi selengkapnya, lihat Blok CIDR Subnet di Panduan Pengguna Amazon VPC.
-
VPC — Pilih VPC yang sudah ada yang memenuhi persyaratan PCS. AWS Untuk informasi selengkapnya, lihat AWS PCS VPC dan persyaratan subnet dan pertimbangan. Setelah Anda membuat cluster, Anda tidak dapat mengubah VPC-nya. Jika tidak VPCs terdaftar, Anda harus membuatnya terlebih dahulu.
-
Subnet - Semua subnet yang tersedia di VPC yang dipilih terdaftar. Pilih subnet yang memenuhi persyaratan subnet AWS PCS. Untuk informasi selengkapnya, lihat AWS PCS VPC dan persyaratan subnet dan pertimbangan. Kami menyarankan Anda memilih subnet pribadi untuk menghindari mengekspos endpoint scheduler Anda ke internet publik.
-
Grup keamanan — Tentukan grup keamanan yang Anda ingin AWS PCS kaitkan dengan antarmuka jaringan yang dibuatnya untuk klaster Anda. Anda harus memilih setidaknya satu grup keamanan yang memungkinkan komunikasi antara cluster Anda dan node komputasinya. Anda dapat memilih Cepat membuat grup keamanan agar AWS PCS membuatnya dengan konfigurasi yang diperlukan di VPC yang Anda pilih, atau pilih grup keamanan yang ada. Untuk informasi selengkapnya, lihat Persyaratan dan pertimbangan kelompok keamanan.
-
-
(Opsional) Di bagian konfigurasi akuntansi Slurm, Anda dapat mengaktifkan akuntansi Slurm dan mengatur parameter akuntansi. Untuk informasi selengkapnya, lihat Akuntansi slurm di PCS AWS.
-
(Opsional) Di bagian konfigurasi Slurm, Anda dapat menentukan opsi konfigurasi Slurm yang mengganti default yang ditetapkan oleh PCS: AWS
-
Turunkan waktu idle — Ini mengontrol berapa lama node komputasi yang disediakan secara dinamis tetap aktif setelah pekerjaan yang ditempatkan pada mereka selesai atau dihentikan. Menyetel ini ke nilai yang lebih panjang dapat membuatnya lebih mungkin bahwa pekerjaan berikutnya dapat berjalan di node, tetapi dapat menyebabkan peningkatan biaya. Nilai yang lebih pendek akan mengurangi biaya, tetapi dapat meningkatkan proporsi waktu yang dihabiskan sistem HPC Anda untuk menyediakan node dibandingkan dengan menjalankan pekerjaan pada mereka.
-
Prolog — Ini adalah jalur yang sepenuhnya memenuhi syarat ke direktori skrip prolog pada instance grup node komputasi Anda. Ini sesuai dengan pengaturan Prolog
di Slurm. Perhatikan bahwa ini harus berupa direktori, bukan jalur ke executable tertentu. -
Epilog — Ini adalah jalur yang sepenuhnya memenuhi syarat ke direktori skrip epilog pada instance grup node komputasi Anda. Ini sesuai dengan pengaturan Epilog
di Slurm. Perhatikan bahwa ini harus berupa direktori, bukan jalur ke executable tertentu. -
Pilih parameter tipe — Ini membantu mengontrol algoritma pemilihan sumber daya yang digunakan oleh Slurm. Menyetel nilai ini
CR_CPU_Memory
akan mengaktifkan penjadwalan sadar memori, sementara menyetelnyaCR_CPU
akan mengaktifkan penjadwalan khusus CPU. Parameter ini sesuai dengan SelectTypeParameterspengaturan di Slurm di mana SelectType
diaturselect/cons_tres
oleh AWS PCS.
-
-
(Opsional) Di bawah Tag, tambahkan tag apa pun ke cluster AWS PCS Anda.
-
Pilih Buat klaster. Bidang Status ditampilkan
Creating
saat AWS PCS membuat cluster. Proses ini dapat memakan waktu beberapa menit.
penting
Hanya ada 1 cluster dalam satu
Creating
keadaan per Wilayah AWS per Akun AWS. AWS PCS mengembalikan kesalahan jika sudah ada cluster dalamCreating
keadaan ketika Anda mencoba membuat cluster. -
- AWS CLI
-
Untuk membuat klaster DB
-
Buat cluster Anda dengan perintah berikut. Sebelum menjalankan perintah, buat penggantian berikut:
-
Ganti
region
dengan ID tempat Wilayah AWS Anda ingin membuat cluster Anda, sepertius-east-1
. -
Ganti
my-cluster
dengan nama untuk cluster Anda. Nama hanya dapat berisi karakter alfanumerik (peka huruf besar/kecil) dan tanda hubung. Itu harus dimulai dengan karakter alfabet dan tidak boleh lebih dari 40 karakter. Nama harus unik di dalam Wilayah AWS dan Akun AWS di mana Anda membuat cluster. -
Ganti
24.11
dengan versi Slurm yang didukung.catatan
AWS PCS saat ini mendukung Slurm 24.11 dan 24.05.
-
Ganti
SMALL
dengan ukuran cluster yang didukung. Ini menentukan berapa banyak pekerjaan bersamaan dan node komputasi yang dapat dikelola oleh cluster AWS PCS. Itu hanya dapat diatur ketika cluster dibuat. Untuk informasi lebih lanjut tentang ukuran, lihatUkuran cluster dalam AWS PCS. -
Ganti nilainya
subnetIds
dengan milik Anda sendiri. Kami menyarankan Anda memilih subnet pribadi untuk menghindari mengekspos endpoint scheduler Anda ke internet publik. -
Tentukan
securityGroupIds
yang Anda ingin AWS PCS kaitkan dengan antarmuka jaringan yang dibuatnya untuk cluster Anda. Grup keamanan harus berada di VPC yang sama dengan cluster. Anda harus memilih setidaknya satu grup keamanan yang memungkinkan komunikasi antara cluster Anda dan node komputasinya. Untuk informasi selengkapnya, lihat Persyaratan dan pertimbangan kelompok keamanan. -
Secara opsional, Anda dapat memberikan kunci KMS khusus untuk mengenkripsi data pengontrol Anda menggunakan.
--kms-key-id
Gantikms-key
dengan ARN KMS, ID kunci, atau alias yang ada. Perhatikan bahwa akun yang digunakan untuk membuat cluster harus memilikikms-key
kms:Decrypt
hak istimewa pada kunci KMS kustom.
aws pcs create-cluster --region
region
\ --cluster-namemy-cluster
\ --scheduler type=SLURM,version=24.11
\ --sizeSMALL
\ --networking subnetIds=subnet-ExampleId1
,securityGroupIds=sg-ExampleId1
-
untuk digunakan IPv6, tambahkan
networkType=IPV6
ke--networking
konfigurasi.--networking networkType=IPV6,subnetIds=
subnet-ExampleId1
,securityGroupIds=sg-ExampleId1
-
Secara opsional, Anda dapat menambahkan
--slurm-configration
opsi untuk menyesuaikan perilaku Slurm dan menentukan opsi konfigurasi Slurm. Contoh berikut menetapkan waktu idle scale-down menjadi 60 menit (3600 detik), memungkinkan akuntansi Slurm, dan menentukanslurm.conf
pengaturan sebagai nilai untuk.slurmCustomSettings
Untuk informasi selengkapnya, lihat Akuntansi slurm di PCS AWS.catatan
Akuntansi didukung untuk Slurm 24.11 atau yang lebih baru.
aws pcs create-cluster --region
region
\ --cluster-namemy-cluster
\ --scheduler type=SLURM,version=24.11
\ --sizeSMALL
\ --networking subnetIds=subnet-ExampleId1
,securityGroupIds=sg-ExampleId1
--slurm-configuration scaleDownIdleTimeInSeconds=3600,accounting='{mode=STANDARD}',slurmCustomSettings='[{parameterName=SelectTypeParameters,parameterValue=CR_CPU_Memory}]'
-
-
Diperlukan beberapa menit untuk menyediakan cluster. Anda dapat melakukan kueri status klaster Anda dengan perintah berikut. Jangan melanjutkan untuk membuat antrian atau menghitung grup node sampai bidang status klaster berada.
ACTIVE
aws pcs get-cluster --region
region
--cluster-identifiermy-cluster
penting
Hanya ada 1 cluster dalam satu
Creating
keadaan per Wilayah AWS per Akun AWS. AWS PCS mengembalikan kesalahan jika sudah ada cluster dalamCreating
keadaan ketika Anda mencoba membuat cluster. -
Langkah selanjutnya yang disarankan untuk klaster Anda
-
Tambahkan grup node komputasi.
-
Tambahkan antrian.
-
Aktifkan logging.