Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Gunakan pola historis untuk menskalakan layanan Amazon ECS dengan penskalaan prediktif
Penskalaan prediktif melihat data beban masa lalu lintas dari arus lalu lintas untuk menganalisis pola harian atau mingguan. Kemudian menggunakan analisis ini untuk mengantisipasi kebutuhan masa depan dan secara proaktif meningkatkan tugas dalam layanan Anda sesuai kebutuhan.
Penskalaan otomatis prediktif paling berguna dalam situasi berikut.
-
Lalu lintas siklus - Peningkatan penggunaan sumber daya selama jam kerja reguler, dan penurunan penggunaan sumber daya selama malam hari dan akhir pekan.
-
Pola on-and-off beban kerja berulang - Contohnya termasuk pemrosesan batch, pengujian, atau analisis data berkala.
-
Aplikasi dengan waktu inisialisasi yang lama - Ini dapat memengaruhi kinerja aplikasi selama peristiwa penskalaan yang menyebabkan latensi yang nyata.
Jika aplikasi Anda membutuhkan waktu lama untuk diinisialisasi dan lalu lintas meningkat dalam pola reguler, Anda harus mempertimbangkan untuk menggunakan penskalaan prediktif. Ini membantu Anda menskalakan lebih cepat dengan secara proaktif meningkatkan jumlah tugas untuk beban yang diperkirakan, alih-alih menggunakan kebijakan penskalaan dinamis, seperti Pelacakan Target atau Penskalaan Langkah saja. Dengan membantu Anda menghindari kemungkinan penyediaan berlebihan jumlah tugas, penskalaan prediktif juga berpotensi menghemat uang Anda.
Misalnya, pertimbangkan aplikasi yang memiliki penggunaan tinggi selama jam kerja dan penggunaan rendah dalam semalam. Pada awal setiap hari kerja, penskalaan prediktif dapat meningkatkan tugas sebelum masuknya lalu lintas pertama. Ini membantu aplikasi Anda mempertahankan ketersediaan dan kinerja tinggi saat beralih dari periode pemanfaatan yang lebih rendah ke periode pemanfaatan yang lebih tinggi. Anda tidak perlu menunggu penskalaan dinamis untuk bereaksi terhadap perubahan lalu lintas. Anda juga tidak perlu menghabiskan waktu meninjau pola pemuatan aplikasi Anda dan mencoba menjadwalkan jumlah tugas yang tepat menggunakan penskalaan terjadwal.
Penskalaan prediktif adalah kemampuan tingkat layanan yang menskalakan tugas layanan Anda secara independen dari penskalaan kapasitas komputasi yang mendasarinya (misalnya, atau Fargate). EC2 Untuk Fargate, AWS mengelola dan secara otomatis menskalakan kapasitas yang mendasarinya berdasarkan persyaratan tugas. Untuk EC2 kapasitas, Anda dapat menggunakan penyedia kapasitas grup Auto Scaling untuk menskalakan EC2 instans dasar secara otomatis berdasarkan persyaratan penskalaan tugas Anda.
Daftar Isi
Cara kerja penskalaan prediktif di Amazon ECS
Di sini Anda dapat mempelajari tentang pertimbangan untuk menggunakan penskalaan prediktif, cara kerjanya, dan apa batasannya.
Pertimbangan untuk menggunakan penskalaan prediktif
-
Anda ingin memastikan penskalaan prediktif cocok untuk beban kerja Anda. Anda dapat memeriksanya dengan mengonfigurasi kebijakan penskalaan dalam mode perkiraan saja dan melihat apa yang direkomendasikan konsol. Anda harus mengevaluasi perkiraan dan rekomendasi sebelum mulai menggunakan penskalaan prediktif.
-
Sebelum penskalaan prediktif dapat memulai peramalan, dibutuhkan setidaknya 24 jam data historis. Semakin banyak data historis yang tersedia, semakin efektif ramalannya, dengan dua minggu ideal. Anda juga harus menunggu 24 jam sebelum penskalaan prediktif dapat menghasilkan perkiraan baru saat Anda menghapus layanan Amazon ECS dan membuat yang baru. Salah satu cara untuk mempercepat ini adalah dengan menggunakan metrik khusus untuk menggabungkan metrik di seluruh layanan Amazon ECS lama dan baru.
-
Pilih metrik pemuatan yang secara akurat mewakili beban penuh pada aplikasi Anda dan merupakan aspek aplikasi Anda yang paling penting untuk diskalakan.
-
Penskalaan dinamis dengan penskalaan prediktif membantu Anda mengikuti permintaan aplikasi dengan cermat, sehingga Anda dapat menskalakan selama jeda dan meningkatkan skala selama peningkatan lalu lintas yang tidak terduga. Ketika beberapa kebijakan penskalaan aktif, setiap kebijakan menentukan jumlah tugas yang diinginkan secara independen, dan jumlah tugas yang diinginkan diatur ke maksimum tugas tersebut.
-
Anda dapat menggunakan penskalaan prediktif di samping kebijakan penskalaan dinamis Anda, seperti pelacakan target atau penskalaan langkah, sehingga aplikasi Anda menskalakan berdasarkan pola real-time dan historis. Dengan sendirinya, penskalaan prediktif tidak menskalakan tugas Anda.
-
Jika Anda menggunakan peran khusus saat memanggil
register-scalable-target
API, Anda mungkin mendapatkan kesalahan yang mengatakan kebijakan penskalaan prediktif hanya dapat berfungsi dengan SLR diaktifkan. Dalam hal ini Anda harus meneleponregister-scalable-target
lagi tetapi tanpa role-arn. Gunakan SLR saat mendaftarkan target yang dapat diskalakan dan panggil API.put-scaling-policy
Cara kerja penskalaan prediktif
Anda menggunakan penskalaan prediktif dengan membuat kebijakan penskalaan prediktif yang menentukan CloudWatch metrik untuk dipantau dan dianalisis. Penskalaan prediktif harus memiliki setidaknya 24 jam data untuk mulai memperkirakan nilai masa depan.
Setelah Anda membuat kebijakan, penskalaan prediktif mulai menganalisis data metrik hingga 14 hari terakhir untuk mengidentifikasi pola. Analisis ini digunakan untuk menghasilkan 48 jam perkiraan persyaratan per jam berikutnya. CloudWatch Data terbaru digunakan untuk memperbarui perkiraan setiap enam jam. Saat data baru masuk, penskalaan prediktif terus meningkatkan akurasi prakiraan masa depan.
Saat Anda pertama kali mengaktifkan penskalaan prediktif, penskalaan ini berjalan dalam mode perkiraan saja. Ini menghasilkan perkiraan dalam mode ini, tetapi tidak menskalakan layanan Amazon ECS Anda berdasarkan perkiraan tersebut. Ini berarti Anda dapat mengevaluasi keakuratan dan kesesuaian ramalan. Anda melihat data perkiraan dengan menggunakan operasi GetPredictiveScalingForecast
API atau AWS Management Console.
Saat Anda memutuskan untuk mulai menggunakan penskalaan prediktif, alihkan kebijakan penskalaan ke mode prakiraan dan skala. Berikut ini terjadi saat dalam mode ini.
Layanan Amazon ECS Anda diskalakan pada awal setiap jam berdasarkan perkiraan untuk jam itu, secara default. Anda dapat memilih untuk memulai lebih awal dengan menggunakan SchedulingBufferTime
properti dalam operasi PutScalingPolicy
API. Ini membuat tugas baru diluncurkan di depan permintaan yang diperkirakan dan memberi mereka waktu untuk boot dan siap menangani lalu lintas.
Batas tugas maksimum
Saat Anda mendaftarkan layanan Amazon ECS untuk penskalaan, Anda menentukan jumlah tugas maksimum yang dapat diluncurkan per layanan. Secara default, ketika kebijakan penskalaan ditetapkan, mereka tidak dapat meningkatkan jumlah tugas yang lebih tinggi dari batas maksimumnya.
Atau, Anda dapat mengizinkan jumlah tugas maksimum layanan ditingkatkan secara otomatis jika perkiraan mendekati atau melebihi jumlah tugas maksimum layanan Amazon ECS.
Awas
Berhati-hatilah saat memungkinkan jumlah tugas maksimum ditingkatkan secara otomatis. Hal ini dapat menyebabkan lebih banyak tugas yang diluncurkan daripada yang dimaksudkan, jika peningkatan jumlah tugas maksimum tidak dipantau dan dikelola. Peningkatan jumlah tugas maksimum kemudian menjadi jumlah tugas maksimum normal baru untuk layanan Amazon ECS hingga Anda memperbaruinya secara manual. Jumlah tugas maksimum tidak secara otomatis berkurang kembali ke maksimum semula.
Wilayah yang didukung
-
Timur AS (N. Virginia)
-
AS Timur (Ohio)
-
AS Barat (California Utara)
-
AS Barat (Oregon)
-
Afrika (Cape Town)
-
Asia Pasifik (Hong Kong)
-
Asia Pasifik (Jakarta)
-
Asia Pasifik (Mumbai)
-
Asia Pasifik (Osaka)
-
Asia Pasifik (Seoul)
-
Asia Pasifik (Singapura)
-
Asia Pasifik (Sydney)
-
Asia Pasifik (Tokyo)
-
Kanada (Pusat)
-
Tiongkok (Beijing)
-
Tiongkok (Ningxia)
-
Eropa (Frankfurt)
-
Eropa (Irlandia)
-
Eropa (London)
-
Eropa (Milan)
-
Eropa (Paris)
-
Eropa (Stockholm)
-
Timur Tengah (Bahrain)
-
Amerika Selatan (Sao Paulo)
-
AWS GovCloud (AS-Timur)
-
AWS GovCloud (AS-Barat)