

# OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti
<a name="ops_workload_observability_create_alerts"></a>

 Sangat penting mendeteksi dan merespons penyimpangan dalam perilaku aplikasi Anda segera. Lebih penting lagi adalah mengenali ketika hasil yang didasarkan pada indikator kinerja utama (KPI) terpapar risiko atau ketika anomali tak terduga muncul. Mendasarkan peringatan pada KPI memastikan bahwa sinyal yang Anda terima berkaitan langsung dengan dampak bisnis atau operasional. Pendekatan terhadap peringatan yang dapat ditindaklanjuti ini mempromosikan respons proaktif dan membantu mempertahankan performa dan keandalan sistem. 

 **Hasil yang diinginkan:** Terima peringatan yang tepat waktu, relevan, dan dapat ditindaklanjuti untuk identifikasi dan mitigasi potensi masalah dengan cepat, terutama ketika hasil KPI berisiko. 

 **Antipola umum:** 
+  Mengonfigurasi terlalu banyak peringatan non-kritis, yang mengakibatkan kewalahan. 
+  Tidak memprioritaskan peringatan berdasarkan KPI, sehingga dampak masalah terhadap bisnis menjadi sulit dipahami. 
+  Mengabaikan penanganan akar masalah, yang berimbas pada peringatan yang repetitif untuk masalah yang sama. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Berkurangnya kewalahan akibat peringatan dengan memusatkan perhatian pada peringatan yang dapat ditindaklanjuti dan relevan. 
+  Waktu aktif dan keandalan sistem yang lebih baik melalui deteksi dan mitigasi masalah secara proaktif. 
+  Kolaborasi tim yang disempurnakan dan penyelesaian masalah yang lebih cepat melalui integrasi alat-alat peringatan dan komunikasi populer. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk membuat mekanisme peringatan yang efektif, sangat penting untuk menggunakan metrik, log, dan data jejak yang menandai kapan hasil yang didasarkan pada KPI mengandung risiko atau terdapat anomali yang terdeteksi. 

### Langkah implementasi
<a name="implementation-steps"></a>

1.  **Tentukan indikator kinerja utama (KPI)**: Identifikasi KPI aplikasi Anda. Peringatan harus dikaitkan dengan KPI tersebut agar mencerminkan dampak bisnis secara akurat. 

1.  **Implementasikan deteksi anomali**: 
   +  **Gunakan deteksi anomali Amazon CloudWatch**: Siapkan [deteksi anomali Amazon CloudWatch](https://docs.aws.amazon.com/Amazon/latest/monitoring/_Anomaly_Detection.html) untuk mendeteksi pola yang tidak biasa secara otomatis, yang membantu Anda hanya menghasilkan peringatan untuk anomali nyata. 
   +  **Gunakan Wawasan AWS X-Ray**: 

     1.  Siapkan [Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) untuk mendeteksi anomali dalam data jejak. 

     1.  Konfigurasikan [notifikasi agar Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) menerima peringatan tentang masalah yang terdeteksi. 
   +  **Integrasikan dengan Amazon DevOps Guru**: 

     1.  Manfaatkan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) untuk kemampuan machine learning-nya dalam mendeteksi anomali operasional pada data yang ada. 

     1.  Buka [pengaturan notifikasi](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings) di DevOps Guru untuk menyiapkan peringatan anomali. 

1.  **Implementasikan peringatan yang dapat ditindaklanjuti**: Rancang peringatan yang menyediakan informasi yang memadai untuk tindakan cepat. 

   1.  Pantau [peristiwa AWS Health dengan aturan Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html), atau integrasikan secara terprogram dengan API AWS Health untuk mengotomatiskan tindakan saat Anda menerima peristiwa AWS Health. Tindakan tersebut dapat berupa tindakan umum, seperti mengirimkan semua pesan peristiwa siklus hidup yang direncanakan ke antarmuka obrolan, atau tindakan khusus seperti inisiasi alur kerja di alat manajemen layanan IT. 

1.  **Kurangi kelelahan akibat peringatan**: Minimalkan peringatan non-kritis. Ketika tim kewalahan dengan banyaknya peringatan yang tidak penting, mereka dapat melewatkan masalah kritis, sehingga mengurangi efektivitas mekanisme peringatan secara keseluruhan. 

1.  **Siapkan alarm komposit**: Gunakan [alarm komposit Amazon CloudWatch](https://aws.amazon.com/bloprove-monitoring-efficiency-using-amazon-cloudwatch-composite-alarms-2/) untuk mengonsolidasikan beberapa alarm. 

1.  **Integrasikan dengan alat peringatan**: Gabungkan alat seperti [Ops Genie](https://www.atlassian.com/software/opsgenie) dan [PagerDuty](https://www.pagerduty.com/). 

1.  **Libatkan Amazon Q Developer in chat applications**: Integrasikan [Amazon Q Developer in chat applications](https://aws.amazon.com/chatbot/) untuk mengirimkan peringatan ke Amazon Chime, Microsoft Teams, dan Slack. 

1.  **Buat peringatan berdasarkan log**: Gunakan [filter metrik log](https://docs.aws.amazon.com/Amazon/latest/logs/MonitoringLogData.html) di CloudWatch untuk membuat alarm berdasarkan peristiwa log tertentu. 

1.  **Tinjau dan lakukan iterasi**: Tinjau dan sempurnakan konfigurasi peringatan secara rutin. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik Terbaik Terkait:** 
+  [OPS04-BP01 Identifikasikan indikator performa utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Mengimplementasikan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Mengimplementasikan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Mengimplementasikan penelusuran terdistribusi](ops_observability_dist_trace.md) 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Menganalisis log beban kerja](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Menganalisis jejak beban kerja](ops_workload_observability_analyze_workload_traces.md) 

 **Dokumen terkait:** 
+  [Using Amazon CloudWatch alarms](https://docs.aws.amazon.com/Amazon/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Create a composite alarm](https://docs.aws.amazon.com/Amazon/latest/monitoring/Create_Composite_Alarm.html) 
+  [Create a CloudWatch alarm based on anomaly detection](https://docs.aws.amazon.com/Amazon/latest/monitoring/Create_Anomaly_Detection_Alarm.html) 
+  [DevOps Guru Notifications](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html) 
+  [X-ray insights notifications](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) 
+  [Monitor, operate, and troubleshoot your AWS resources with interactive ChatOps](https://aws.amazon.com/chatbot/) 
+  [Panduan Integrasi Amazon CloudWatch \| PagerDuty](https://support.pagerduty.com/docs/amazon-cloudwatch-integration-guide) 
+  [Integrate Opsgenie with Amazon CloudWatch](https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-amazon-cloudwatch/) 

 **Video terkait:** 
+  [Membuat Alarm Komposit di Amazon CloudWatch](https://www.youtube.com/watch?v=0LMQ-Mu-ZCY) 
+  [Gambaran umum Amazon Q Developer in chat applications](https://www.youtube.com/watch?v=0jUSEfHbTYk) 
+  [AWS On Air ft. Perintah Mutatif di Amazon Q Developer in chat applications](https://www.youtube.com/watch?v=u2pkw2vxrtk) 

 **Contoh terkait:** 
+  [Alarm, manajemen insiden, dan remediasi di cloud dengan Amazon CloudWatch](https://aws.amazon.com/bloarms-incident-management-and-remediation-in-the-cloud-with-amazon-cloudwatch/) 
+  [Tutorial: Membuat aturan Amazon EventBridge yang mengirimkan notifikasi ke Amazon Q Developer in chat applications](https://docs.aws.amazon.com/chatbot/latest/adminguide/create-eventbridge-rule.html) 
+  [Lokakarya One Observability](https://catalog.workshops.aws/observability/en-US/intro) 