

# OPS08-BP04 Erstellen umsetzbarer Warnmeldungen
<a name="ops_workload_observability_create_alerts"></a>

 Es ist entscheidend, Abweichungen im Verhalten Ihrer Anwendung umgehend zu erkennen und darauf zu reagieren. Besonders wichtig ist es, zu erkennen, wann die auf den wichtigsten Leistungsindikatoren (KPIs) basierenden Ergebnisse gefährdet sind oder unerwartete Anomalien auftreten. Wenn Sie Warnmeldungen auf KPIs basieren, stellen Sie dadurch sicher, dass die Signale, die Sie erhalten, direkt mit geschäftlichen oder betrieblichen Auswirkungen verknüpft sind. Der Ansatz mit umsetzbaren Warnmeldungen fördert proaktive Reaktionen und trägt zur Aufrechterhaltung der Systemleistung und Zuverlässigkeit bei. 

 **Gewünschtes Ergebnis:** Sie erhalten rechtzeitig relevante und umsetzbare Warnmeldungen, um potenzielle Probleme schnell zu erkennen und zu beheben, insbesondere wenn die KPI-Ergebnisse gefährdet sind. 

 **Typische Anti-Muster:** 
+  Es werden zu viele unkritische Warnmeldungen eingerichtet, was zu einer Alarmmüdigkeit führt. 
+  Warnmeldungen werden nicht anhand von KPIs priorisiert, was es schwierig macht, die geschäftlichen Auswirkungen von Problemen zu verstehen. 
+  Die eigentlichen Ursachen werden vernachlässigt, was zu wiederholten Warnmeldungen für dasselbe Problem führt. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Geringere Alarmermüdung durch Fokussierung auf umsetzbare und relevante Warnmeldungen. 
+  Verbesserte Systemverfügbarkeit und -zuverlässigkeit durch proaktive Problemerkennung und -behebung. 
+  Verbesserte Teamzusammenarbeit und schnellere Problemlösung durch die Integration in übliche Alarmierungs- und Kommunikationstools. 

 **Risikostufe bei fehlender Befolgung dieser bewährten Methode:** Hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Um einen effektiven Warnmechanismus zu schaffen, ist es wichtig, Metriken, Protokolle und Trace-Daten zu verwenden, die darauf hinweisen, wenn auf KPIs basierende Ergebnisse gefährdet sind oder Anomalien erkannt werden. 

### Implementierungsschritte
<a name="implementation-steps"></a>

1.  **Festlegen der wichtigsten Leistungskennzahlen (KPIs)**: Identifizieren Sie die KPIs Ihrer Anwendung. Warnmeldungen sollten mit diesen KPIs verknüpft werden, damit sie die Auswirkungen auf das Unternehmen genau widerspiegeln. 

1.  **Implementierung der Erkennung von Anomalien**: 
   +  **Verwenden von Amazon CloudWatch-Anomalieerkennung**: Richten Sie die [Amazon CloudWatch-Anomalieerkennung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) so ein, dass ungewöhnliche Muster automatisch erkannt werden. So werden nur Warnmeldungen für echte Anomalien generiert. 
   +  **Nutzung von AWS X-Ray-Insights**: 

     1.  Richten Sie [X-Ray-Insights](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) ein, um Anomalien in Trace-Daten zu erkennen. 

     1.  Konfigurieren Sie [Benachrichtigungen für X-Ray-Insights](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications), um bei erkannten Problemen gewarnt zu werden. 
   +  **Integration mit Amazon DevOps Guru**: 

     1.  Nutzen Sie [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) für seine Machine-Learning-Funktionen für die Erkennung betrieblicher Anomalien anhand vorhandener Daten. 

     1.  Navigieren Sie zu den [Benachrichtigungseinstellungen](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings) in DevOps Guru, um Warnmeldungen über Anomalien einzurichten. 

1.  **Implementieren umsetzbarer Warnmeldungen**: Entwerfen Sie Warnmeldungen, die angemessene Informationen für sofortige Maßnahmen liefern. 

   1.  Überwachen Sie [AWS Health-Ereignisse mit Amazon-EventBridge-Regeln](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html) oder integrieren Sie sie programmatisch mit der AWS Health API, um Aktionen zu automatisieren, wenn Sie AWS Health-Ereignisse empfangen. Dies können allgemeine Aktionen sein, z. B. das Senden aller geplanten Lebenszyklus-Ereignisnachrichten an eine Chat-Oberfläche, oder spezifische Aktionen, wie das Initiieren eines Workflows in einem IT-Servicemanagement-Tool. 

1.  **Verringern der Alarmmüdigkeit**: Minimieren Sie die Zahl der Warnmeldungen, die nicht kritisch sind. Wenn Teams mit zahllosen unbedeutenden Warnmeldungen überfordert werden, können sie den Überblick über kritische Probleme verlieren, was die Gesamteffektivität des Warnmechanismus beeinträchtigt. 

1.  **Einrichten zusammengesetzter Alarme**: Verwenden Sie [zusammengesetzte Alarme in Amazon CloudWatch](https://aws.amazon.com/bloprove-monitoring-efficiency-using-amazon-cloudwatch-composite-alarms-2/), um mehrere Alarme zu konsolidieren. 

1.  **Integration mit Warnmeldungs-Tools**: Integrieren Sie Tools wie [Ops Genie](https://www.atlassian.com/software/opsgenie) und [PagerDuty](https://www.pagerduty.com/). 

1.  **Einbinden von Amazon Q Developer in Chat-Anwendungen**: Integration von [Amazon Q Developer in Chat-Anwendungen](https://aws.amazon.com/chatbot/) zur Weiterleitung von Warnungen an Amazon Chime, Microsoft Teams und Slack. 

1.  **Auf Protokollen basierende Warnungen**: Verwenden Sie [metrische Protokollfilter](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) in CloudWatch, um Alarme auf der Grundlage bestimmter Protokollereignisse zu erstellen. 

1.  **Überprüfen und wiederholen**: Überprüfen und verfeinern Sie die Warnkonfigurationen regelmäßig. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
<a name="resources"></a>

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Implementieren Sie Anwendungstelemetrie](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Implementieren Sie Benutzererlebnis-Telemetrie](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Implementieren Sie verteiltes Tracing](ops_observability_dist_trace.md) 
+  [OPS08-BP01 Analysieren Sie Workload-Metriken](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Analysieren Sie Workload-Protokolle](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Analysieren Sie Workload-Traces](ops_workload_observability_analyze_workload_traces.md) 

 **Zugehörige Dokumente:** 
+  [Verwenden von Amazon-CloudWatch-Alarmen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Erstellen eines zusammengesetzten Alarms](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html) 
+  [Erstellen eines CloudWatch-Alarms basierend auf Anomalieerkennung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) 
+  [DevOps Guru Notifications](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html) 
+  [X-ray insights notifications](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) 
+  [Überwachung, Betrieb und Fehlerbehebung Ihrer AWS-Ressourcen mit interaktiven ChatOps](https://aws.amazon.com/chatbot/) 
+  [Amazon CloudWatch Integration Guide \$1 PagerDuty](https://support.pagerduty.com/docs/amazon-cloudwatch-integration-guide) 
+  [Integrate Opsgenie with Amazon CloudWatch](https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-amazon-cloudwatch/) 

 **Zugehörige Videos:** 
+  [Create Composite Alarms in Amazon CloudWatch](https://www.youtube.com/watch?v=0LMQ-Mu-ZCY) 
+  [Überblick über Amazon Q Developer in Chat-Anwendungen](https://www.youtube.com/watch?v=0jUSEfHbTYk) 
+  [AWS On Air ft. Mutative Befehle in Amazon Q Developer in Chat-Anwendungen](https://www.youtube.com/watch?v=u2pkw2vxrtk) 

 **Zugehörige Beispiele:** 
+  [Alarme, Vorfallmanagement und Problembehebung in der Cloud mit Amazon CloudWatch](https://aws.amazon.com/bloarms-incident-management-and-remediation-in-the-cloud-with-amazon-cloudwatch/) 
+  [Tutorial: Erstellen einer Amazon-EventBridge-Regel, die Benachrichtigungen an Amazon Q Developer in Chat-Anwendungen sendet](https://docs.aws.amazon.com/chatbot/latest/adminguide/create-eventbridge-rule.html) 
+  [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US/intro) 