View a markdown version of this page

Dokumen hasil percobaan - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Dokumen hasil percobaan

Konfigurasi

Dokumentasikan konfigurasi spesifik untuk percobaan. Misalnya:

  • Pembuatan beban diatur untuk mensimulasikan pengguna 5K yang mengeluarkan total 85 permintaan per detik.

Prasyarat

  • Memverifikasi bahwa situs adopsi hewan peliharaan berjalan di lingkungan pengujian alfa.

  • Memverifikasi bahwa template eksperimen telah dikonfigurasi untuk menerapkan stress CPU ke pod PetSite aplikasi yang berjalan di cluster EKS.  Pod aplikasi diidentifikasi oleh label Kubernetes. app=petsite

  • Beban dikonfirmasi berjalan dan menghasilkan 85 permintaan per detik.

Keadaan mantap

Dokumentasikan langkah-langkah yang diambil untuk mencapai kondisi tunak dan bagaimana Anda memverifikasinya. Misalnya:

Untuk penerapan pengujian situs adopsi hewan peliharaan, beban 85 RPS sedang dihasilkan untuk mensimulasikan kondisi tunak. CloudWatch RUM dan CloudWatch dasbor ditinjau untuk memverifikasi bahwa semua metrik bisnis dan aplikasi berada dalam rentang normal sebelum pelaksanaan percobaan.

Data observabilitas:

Expected Diamati
  • LCP kurang dari 4 detik untuk P99 permintaan.

  • Latensi respons kurang dari 500 ms.

  • Tidak ada kesalahan 4XX atau 5XX.

Laporan keadaan mapan 1 untuk eksperimen kekacauan.

Laporan keadaan mantap 2 untuk eksperimen kekacauan.

Injeksi kesalahan

AWS FIS digunakan untuk menyuntikkan kesalahan dengan menggunakan templat percobaan (berikan tautan). Eksperimen diatur untuk berjalan selama 10 menit, dan rollback dikonfigurasi jika node pekerja mengalami stres CPU lebih dari 60 persen.

Pengamatan kesalahan

CloudWatch RUM dan CloudWatch dasbor ditinjau untuk melacak kondisi tunak aplikasi (ditentukan dengan menggunakan metrik LCP).  Tangkapan layar ditangkap dalam tabel berikut.

Data observabilitas:

Expected Diamati
  • LCP harus tetap di bawah 4 detik untuk P99.

  • Waktu respons harus tetap di bawah 500 ms.

  • Tidak ada kesalahan 4XX atau 5XX yang harus ditemui.

Laporan pengamatan kesalahan 1 untuk eksperimen kekacauan.

Laporan pengamatan kesalahan 2 untuk eksperimen kekacauan.

Pemulihan

Setelah stress telah dihapus ( AWS FIS percobaan telah menyelesaikan dan menghapus stres CPU dari pod), aplikasi harus melanjutkan kondisi tunak normalnya.  Tidak ada intervensi manual yang diperlukan.

Data observabilitas:

Expected Diamati (tangkapan layar)

LCP P99 harus di bawah 4 detik dengan rata-rata di bawah 2,5 detik.

Contoh hasil pemulihan dari eksperimen chaos.