PERF07-BP06 Memantau dan membuat alarm secara proaktif - AWS Well-Architected Framework

PERF07-BP06 Memantau dan membuat alarm secara proaktif

Gunakan indikator kinerja utama (KPI), yang digabungkan dengan sistem pamantauan dan peringatan, untuk menangani masalah terkait kinerja secara proaktif. Gunakan alarm untuk memicu tindakan otomatis untuk memperbaiki masalah ketika memungkinkan. Teruskan alarm ke personel yang mampu merespons jika respons otomatis tidak memungkinkan. Misalnya, Anda mungkin memiliki sistem yang dapat memprediksi nilai dan alarm indikator kinerja utama (KPI) yang diharapkan ketika melanggar ambang batas tertentu, atau sebuah alat yang dapat menghentikan atau membatalkan deployment secara otomatis jika KPI berada di luar nilai yang diharapkan.

Implementasikan proses yang menyediakan visibilitas tentang kinerja saat beban kerja Anda berjalan. Bangun dasbor pemantauan dan buat norma acuan untuk harapan kinerja guna menentukan apakah beban kerja berkinerja secara optimal.

Antipola umum:

  • Anda hanya membekali staf operasional dengan kemampuan untuk membuat perubahan operasional pada beban kerja.

  • Anda membiarkan semua alarm disaring ke tim operasi tanpa perbaikan proaktif.

Manfaat menjalankan praktik terbaik ini: Perbaikan tindakan alarm yang proaktif memungkinkan staf dukungan untuk berkonsentrasi pada item-item yang tidak dapat ditindaklanjuti secara otomatis. Ini memastikan bahwa staf operasi tidak kewalahan dengan semua alarm dan mereka hanya berkonsentrasi pada alarm yang kritis.

Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan: Rendah

Panduan implementasi

Pantau kinerja selama operasi: Implementasikan proses yang menyediakan visibilitas tentang kinerja saat beban kerja Anda berjalan. Bangun dasbor pemantauan dan buat dasar acuan untuk harapan kinerja.

Sumber daya

Dokumen terkait:

Video terkait:

Contoh terkait: