PERF02-BP02 Memahami opsi konfigurasi komputasi yang tersedia
Setiap solusi komputasi memiliki opsi dan konfigurasi yang tersedia untuk mendukung karakteristik beban kerja Anda. Pelajari bagaimana beragam opsi melengkapi beban kerja Anda, dan apa opsi konfigurasi yang terbaik untuk aplikasi Anda. Contoh dari opsi tersebut meliputi family instans, ukuran, fitur (GPU, I/O), lonjakan, waktu habis, ukuran fungsi, instans kontainer, dan konkurensi.
Hasil yang diinginkan: Karakteristik beban kerja yang mencakup CPU, memori, jaringan throughput, GPU, IOPS, pola lalu lintas, serta pola akses data, didokumentasikan dan digunakan untuk mengonfigurasi solusi komputasi untuk menyesuaikan karakteristik beban kerja. Setiap metrik tersebut serta metrik kustom khusus untuk beban kerja Anda direkam, dipantau, kemudian digunakan untuk mengoptimalkan konfigurasi komputasi guna memenuhi persyaratan.
Antipola umum:
-
Menggunakan solusi komputasi yang sama dengan yang digunakan on-premise.
-
Tidak meninjau opsi komputasi atau family instans untuk menyesuaikan karakteristik beban kerja.
-
Menetapkan ukuran yang berlebihan pada komputasi untuk memastikan kemampuan lonjakan.
-
Anda menggunakan beberapa platform manajemen komputasi untuk beban kerja yang sama.
Manfaat menjalankan praktik terbaik ini: Kenali penawaran komputasi AWS sehingga Anda dapat menentukan solusi yang tepat untuk setiap beban kerja Anda. Setelah Anda memilih penawaran komputasi untuk beban kerja Anda, Anda bisa bereksperimen secara cepat dengan penawaran komputasi tersebut untuk menentukan apakah kebutuhan kerja Anda dapat dipenuhi dengan baik. Solusi komputasi yang dioptimalkan untuk memenuhi karakteristik beban kerja akan meningkatkan kinerja Anda, menurunkan biaya, dan meningkatkan keandalan Anda.
Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan: Tinggi
Panduan implementasi
Jika beban kerja Anda telah menggunakan opsi komputasi yang sama selama lebih dari empat pekan dan Anda mengantisipasi bahwa karakteristiknya akan tetap sama di masa depan, Anda dapat menggunakan AWS Compute Optimizer
Langkah Implementasi:
-
Apakah Anda menjalankan instans EC2 atau kontainer dengan EC2 Launch Type?
-
Apakah beban kerja Anda dapat menggunakan GPU untuk meningkatkan kinerja?
-
Instans Komputasi Terakselerasi
adalah instans berbasis GPU yang menyediakan kinerja tertinggi bagi pelatihan machine learning, inferensi, dan komputasi kinerja tinggi.
-
-
Apakah beban kerja Anda menjalankan aplikasi inferensi machine learning?
-
AWS Inferentia (Inf1)
— Instans Inf1 dibuat untuk mendukung aplikasi inferensi machine learning. Dengan menggunakan instans Inf1, pelanggan dapat menjalankan aplikasi inferensi machine learning berskala besar, seperti pengenalan gambar, pengenalan suara, pemrosesan bahasa alami, personalisasi, dan deteksi penipuan. Anda dapat membuat model pada salah satu kerangka kerja machine learning terkenal, seperti TensorFlow, PyTorch, atau MXNet serta menggunakan instans GPU, untuk melatih model Anda. Setelah model machine learning Anda terlatih untuk memenuhi persyaratan Anda, Anda bisa men-deploy model tersebut di instans Inf1 dengan menggunakan AWS Neuron , kit pengembangan perangkat lunak (SDK) khusus yang terdiri dari pengompilasi, waktu proses, dan alat profiling yang mengoptimalkan kinerja inferensi machine learning chip Inferensi.
-
-
Apakah beban kerja Anda berintegrasi dengan perangkat keras tingkat rendah untuk meningkatkan kinerja?
-
Field Programmable Gate Arrays (FPGA)
— Menggunakan FPGA, Anda bisa mengoptimalkan beban kerja Anda dengan pelaksanaan yang dipercepat perangkat keras kustom untuk beban kerja Anda yang paling berat. Anda dapat menentukan algoritme dengan memanfaatkan bahasa pemrograman umum yang didukung seperti C atau Go, atau bahasa berorientasi perangkat keras seperti Verilog atau VHDL.
-
-
Apakah Anda memiliki metrik selama setidaknya empat pekan dan dapat memprediksi bahwa pola lalu lintas serta metrik Anda akan tetap sama di masa depan?
-
Gunakan Compute Optimizer
untuk mendapatkan rekomendasi machine learning mengenai konfigurasi komputasi mana yang paling cocok dengan karakteristik komputasi Anda.
-
-
Apakah kinerja beban kerja Anda terkendala oleh metrik CPU?
-
Instans komputasi yang dioptimalkan
ideal untuk beban kerja yang memerlukan prosesor kinerja tinggi.
-
-
Apakah kinerja beban kerja Anda terkendala oleh metrik memori?
-
Instans memori yang dioptimalkan
mengirimkan sejumlah besar memori untuk mendukung beban kerja intensif memori.
-
-
Apakah kinerja beban kerja Anda terkendala oleh IOPS?
-
Instans penyimpanan yang dioptimalkan
didesain untuk beban kerja yang memerlukan akses baca dan tulis sekuensial (IOPS) yang tinggi ke penyimpanan lokal.
-
-
Apakah karakteristik beban kerja Anda merepresentasikan kebutuhan seimbang di seluruh metrik?
-
Apakah CPU beban kerja Anda perlu melonjak untuk menangani peningkatan lalu lintas?
-
Instans Kinerja yang Dapat Melonjak
serupa dengan instans Komputasi yang Dioptimalkan kecuali adaya penawaran kemampuan untuk melonjak melewati dasar CPU tetap yang teridentifikasi pada instans komputasi yang dioptimalkan.
-
-
Instans Tujuan Umum
menyediakan keseimbangan semua karakteristik untuk mendukung beragam beban kerja.
-
-
Apakah instans komputasi Anda berjalan di Linux dan terkendala oleh throughput jaringan di kartu antarmuka jaringan?
-
Peninjauan Pertanyaan Kinerja 5, Praktik Terbaik 2: Evaluasi fitur jaringan yang tersedia untuk menemukan jenis dan family instans yang tepat untuk memenuhi kebutuhan kinerja Anda.
-
-
Apakah beban kerja Anda memerlukan instans yang konsisten dan dapat diprediksi pada Zona Ketersediaan spesifik yang dapat Anda terapkan selama setahun?
-
Instans Terpesan
mengonfirmasi reservasi kapasitas pada Zona Ketersediaan tertentu. Instans Terpesan ideal untuk daya komputasi yang diperlukan di Zona Ketersediaan tertentu.
-
-
Apakah beban kerja Anda memiliki lisensi yang memerlukan perangkat keras khusus?
-
Host Khusus
mendukung lisensi perangkat lunak yang ada dan membantu Anda memenuhi persyaratan kepatuhan.
-
-
Apakah solusi komputasi Anda melonjak dan memerlukan pemrosesan sinkron?
-
Instans Sesuai Permintaan
memungkinkan Anda menggunakan kapasitas komputasi per jam atau per detik tanpa komitmen jangka panjang. Instans ini bagus untuk lonjakan di atas kebutuhan dasar kinerja.
-
-
Apakah solusi komputasi Anda stateless, toleran terhadap kesalahan, dan asinkron?
-
Instans Spot
memungkinkan Anda memanfaatkan kapasitas instans yang tidak terpakai untuk beban kerja stateless dan toleran terhadap kesalahan.
-
-
-
Apakah Anda menjalankan kontainer di Fargate
? -
Apakah kinerja tugas Anda terkendala oleh memori atau CPU?
-
Gunakan Task Size untuk menyesuaikan memori atau CPU Anda.
-
-
Apakah kinerja Anda terpengaruh oleh lonjakan pola lalu lintas?
-
Gunakan konfigurasi Auto Scaling untuk menyesuaikan pola lalu lintas Anda.
-
-
-
Apakah solusi komputasi Anda ada di Lambda?
-
Apakah Anda memiliki metrik selama setidaknya empat pekan dan dapat memprediksi bahwa pola lalu lintas serta metrik Anda akan tetap sama di masa depan?
-
Gunakan Compute Optimizer
untuk mendapatkan rekomendasi machine learning mengenai konfigurasi komputasi mana yang paling cocok dengan karakteristik komputasi Anda.
-
-
Apakah Anda tidak memiliki metrik yang cukup untuk menggunakan AWS Compute Optimizer?
-
Jika Anda tidak memiliki metrik yang tersedia untuk menggunakan Compute Optimizer, gunakan AWS Lambda Power Tuning untuk membantu memilih konfigurasi terbaik.
-
-
Apakah kinerja fungsi Anda terkendala oleh memori atau CPU?
-
Konfigurasikan memori Lambda Anda untuk memenuhi metrik kebutuhan kinerja Anda.
-
-
Apakah fungsi Anda mengalami waktu habis dalam pelaksanaannya?
-
Apakah kinerja fungsi Anda terkendala oleh lonjakan aktivitas dan konkurensi?
-
Konfigurasikan pengaturan konkurensi untuk memenuhi persyaratan kinerja Anda.
-
-
Apakah fungsi Anda berjalan dengan asinkron dan mengalami kegagalan pada percobaan ulang?
-
Konfigurasikan usia maksimum peristiwa dan batas percobaan ulang maksimum pada pengaturan konfigurasi asinkron.
-
-
Tingkat upaya untuk rencana implementasi:
Untuk menerapkan praktik terbaik ini, Anda harus mengetahui metrik dan karakteristik komputasi Anda saat ini. Mengumpulkan metrik tersebut, membuat dasar acuan, kemudian menggunakan metrik tersebut untuk mengidentifikasi opsi komputasi yang ideal memiliki tingkat upaya rendah ke kedang . Hal ini divalidasi dengan eksperimen dan uji beban.
Sumber daya
Dokumen terkait:
Video terkait:
Contoh terkait: