Pilar keandalan - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pilar keandalan

Pilar keandalan dari AWS Well-Architected Framework membahas seberapa baik suatu sistem mempertahankan fungsionalitas dan tingkat kinerja yang dimaksudkan selama periode operasional yang diharapkan sepanjang masa pakainya. Ini memberikan pedoman komprehensif untuk membangun dan memelihara sistem yang dapat diandalkan AWS, termasuk strategi untuk pengujian dan validasi di semua tahapan siklus hidup beban kerja.

Area fokus utama untuk menerapkan pilar ini ke lingkungan streaming WorkSpaces Aplikasi Anda:

  • Manajemen dan penskalaan armada

  • Keandalan sesi

  • Ketersediaan aplikasi

  • Prosedur pemulihan

Secara otomatis pulih dari kegagalan

Pantau nilai bisnis KPIs untuk memicu respons otomatis yang dapat memprediksi, mencegah, atau memulihkan dari kegagalan sebelum berdampak pada operasi.

  • Pastikan bahwa alokasi subnet IP Anda memperhitungkan ekspansi dan ketersediaan.

  • Pantau CloudWatch metrik penting untuk memastikan ketersediaan dan kinerja layanan, termasuk metrik kapasitas armada seperti AvailableCapacity danInUseCapacity, dan metrik kualitas streaming seperti. StreamingSessionLatency

  • Konfigurasikan peringatan untuk ambang kapasitas, metrik kesehatan sesi, penurunan kinerja, dan perubahan status kesehatan armada.

  • Gunakan kemampuan penskalaan otomatis WorkSpaces Aplikasi bawaan untuk:

    • Konfigurasikan kapasitas armada minimum dan maksimum.

    • Tetapkan kebijakan penskalaan berdasarkan pemanfaatan kapasitas.

    • Tentukan ambang batas scale-out dan scale-in berdasarkan metrik pengalaman pengguna dan persyaratan bisnis, bukan hanya metrik teknis.

  • Bangun lingkungan pemulihan bencana untuk lingkungan WorkSpaces Aplikasi Anda. Untuk informasi lebih lanjut, lihat posting AWS blog Pertimbangan pemulihan bencana dengan WorkSpaces Aplikasi Amazon.

Uji prosedur pemulihan

Lingkungan cloud memungkinkan pengujian otomatis skenario kegagalan dan prosedur pemulihan. Kemampuan ini membantu Anda mengidentifikasi dan memperbaiki kerentanan sebelum kegagalan nyata terjadi.

  • Pengujian pemulihan armada. Menerapkan pengujian pemulihan armada yang komprehensif di beberapa skenario:

    • Simulasikan penghentian instans untuk memverifikasi respons penskalaan otomatis.

    • Validasi pemeliharaan kapasitas minimum armada.

    • Uji waktu penggantian instance dan pengalihan pengguna.

    • Validasi efektivitas kebijakan penskalaan.

    • Uji batas kapasitas armada dan penanganan luapan.

  • Pengujian pemulihan sesi. Menerapkan prosedur validasi pemulihan sesi:

    • Uji skenario pemutusan dan sambungkan kembali.

    • Verifikasi pelestarian status aplikasi.

    • Uji berbagai skenario gangguan jaringan.

    • Validasi perilaku batas waktu sesi.

    • Verifikasi persistensi otentikasi pengguna.

    • Verifikasi penanganan penyimpanan sementara.

Skala horizontal untuk meningkatkan ketersediaan beban kerja agregat

Distribusikan beban kerja Anda di beberapa sumber daya yang lebih kecil untuk meminimalkan dampak kegagalan individu dan untuk menghilangkan satu titik kegagalan.

  • Menerapkan instance armada di beberapa Availability Zone.

  • Konfigurasikan kapasitas armada minimum yang sesuai.

  • Konfigurasikan penskalaan otomatis untuk armada dan tetapkan ambang batas penskalaan yang sesuai.

  • Pantau pemanfaatan kapasitas di seluruh armada.

  • Menerapkan tumpukan WorkSpaces Aplikasi di beberapa Wilayah. Untuk informasi selengkapnya, lihat posting AWS blog Optimalkan pengalaman pengguna dengan perutean berbasis latensi untuk Aplikasi Amazon. WorkSpaces

Berhenti menebak kapasitas

Gunakan kemampuan penskalaan otomatis cloud untuk menyesuaikan sumber daya secara dinamis berdasarkan permintaan. Ini membantu mencegah kejenuhan sumber daya sambil mempertahankan efisiensi optimal.

  • Pantau metrik kunci sepertiCapacityUtilization,AvailableCapacity, dan InUseCapacity untuk memahami kebutuhan kapasitas.

  • Lacak tren pemanfaatan armada di berbagai periode waktu. Pantau pola harian, variasi mingguan, tren bulanan, dan puncak musiman.

  • Siapkan kebijakan penskalaan dan konfigurasikan ambang batas penskalaan.

  • Pastikan ada celah yang cukup antara kuota saat ini dan penggunaan maksimum untuk mengakomodasi failover.

  • Mengakomodasi kuota dan kendala layanan tetap melalui arsitektur Anda.

Kelola perubahan melalui otomatisasi

Menerapkan perubahan infrastruktur melalui otomatisasi, termasuk perubahan yang dikendalikan versi pada kode otomatisasi itu sendiri.