PERF02-BP05 Menskalakan sumber daya komputasi Anda secara dinamis
Gunakan elastisitas cloud untuk menaikkan atau menurunkan skala sumber daya komputasi Anda secara dinamis agar sesuai dengan kebutuhan Anda dan hindari kapasitas penyediaan yang berlebihan atau terlalu sedikit untuk beban kerja Anda.
Antipola umum:
-
Anda bereaksi pada alarm dengan meningkatkan kapasitas secara manual.
-
Anda menggunakan pedoman penyesuaian ukuran yang sama (umumnya infrastruktur statis) seperti di on-premise.
-
Anda membiarkan peningkatan kapasitas setelah peristiwa penskalaan, bukannya menurunkan kembali skala.
Manfaat menjalankan praktik terbaik ini: Mengonfigurasi dan menguji elastisitas sumber daya komputasi dapat membantu Anda menghemat dana, mempertahankan tolok ukur kinerja, dan meningkatkan keandalan saat lalu lintas berubah.
Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan: Tinggi
Panduan implementasi
AWS memberikan fleksibilitas untuk menaikkan atau menurunkan skala sumber daya Anda secara dinamis melalui berbagai mekanisme penskalaan untuk memenuhi perubahan permintaan. Digabungkan dengan metrik yang terkait dengan komputasi, penskalaan dinamis memungkinkan beban kerja untuk merespons perubahan secara otomatis dan menggunakan rangkaian optimal sumber daya komputasi untuk mencapai tujuannya.
Anda dapat menggunakan sejumlah pendekatan yang berbeda untuk menyesuaikan pasokan sumber daya dengan permintaan.
-
Pendekatan pelacakan target: Pantau metrik penskalaan Anda dan tingkatkan atau turunkan kapasitas secara otomatis sesuai kebutuhan.
-
Penskalaan prediktif: Lakukan penskalaan dalam mengantisipasi tren harian dan mingguan.
-
Pendekatan berbasis jadwal: Tetapkan jadwal penskalaan Anda sendiri sesuai dengan perubahan beban yang dapat diprediksi.
-
Penskalaan layanan: Pilih layanan (seperti nirserver) yang secara otomatis menskalakan sesuai rancangan.
Anda harus memastikan bahwa deployment beban kerja dapat menangani peristiwa kenaikan dan penurunan skala.
Langkah implementasi
-
Kontainer, fungsi, dan instans komputasi menyediakan mekanisme bagi elastisitas melalui kombinasi dengan penskalaan otomatis atau sebagai fitur layanan. Berikut beberapa contoh mekanisme penskalaan otomatis:
Mekanisme Penskalaan Otomatis Di mana harus menggunakan Amazon EC2 Auto Scaling Untuk memastikan Anda memiliki jumlah yang tepat untuk instans Amazon EC2 yang tersedia guna menangani beban pengguna untuk aplikasi Anda. Application Auto Scaling Untuk secara otomatis menskalakan sumber daya bagi layanan AWS individu di luar Amazon EC2, seperti fungsi AWS Lambda atau layanan Amazon Elastic Container Service (Amazon ECS) . Kubernetes Cluster Autoscaler/Karpenter Untuk secara otomatis menskalakan klaster Kubernetes. -
Penskalaan sering dibahas terkait dengan layanan komputasi seperti Instans Amazon EC2 atau fungsi AWS Lambda. Pastikan juga untuk mempertimbangkan konfigurasi layanan nonkomputasi seperti AWS Glue untuk mengimbangi permintaan.
-
Pastikan metrik untuk penskalaan cocok dengan karakteristik beban kerja yang sedang digunakan. Jika Anda men-deploy aplikasi transkode video, 100% pemanfaatan CPU adalah hal normal dan tidak boleh menjadi metrik primer Anda. Gunakan kedalaman antrean tugas transkode sebagai gantinya. Anda dapat menggunakan metrik yang disesuaikan
untuk kebijakan penskalaan Anda jika diperlukan. Untuk memilih metrik yang tepat, pertimbangkan panduan berikut untuk Amazon EC2: -
Metrik harus merupakan metrik pemanfaatan yang valid dan mendeskripsikan tingkat kesibukan suatu instans.
-
Nilai metrik harus meningkat atau menurun secara proporsional dengan jumlah instans dalam grup Auto Scaling.
-
-
Pastikan Anda menggunakan penskalaan dinamis, bukan penskalaan manual untuk grup Auto Scaling Anda. Sebaiknya gunakan juga kebijakan penskalaan pelacakan target dalam penskalaan dinamis.
-
Pastikan deployment beban kerja dapat menangani event penskalaan (naik dan turun). Sebagai contoh, Anda dapat menggunakan Riwayat aktivitas guna memastikan aktivitas penskalaan untuk grup Auto Scaling.
-
Evaluasi beban kerja Anda untuk pola terprediksi dan secara proaktif skalakan saat Anda mengantisipasi perubahan terencana dan terprediksi dalam permintaan. Dengan penskalaan prediktif, Anda dapat meniadakan kebutuhan untuk menyediakan kapasitas secara berlebih. untuk detail selengkapnya, lihat Penskalaan Prediktif dengan Amazon EC2 Auto Scaling
.
Sumber daya
Dokumen terkait:
Video terkait:
Contoh terkait: