

# Nutzung der Workload-Beobachtbarkeit
Nutzung der Workload-Beobachtbarkeit

Sorgen Sie für einen optimalen Zustand der Workload, indem Sie die Beobachtbarkeit nutzen. Nutzen Sie relevante Metriken, Protokolle und Ablaufverfolgungen, um sich einen umfassenden Überblick über die Leistung Ihrer Workload zu verschaffen und Probleme effizient zu beheben.

Beobachtbarkeit ermöglicht es Ihnen, sich auf aussagekräftige Daten zu konzentrieren und die Interaktionen und Ergebnisse Ihrer Workloads zu verstehen. Indem Sie sich auf wichtige Erkenntnisse konzentrieren und unnötige Daten eliminieren, behalten Sie einen einfachen Ansatz zum Verständnis der Workload-Leistung bei.

Es ist wichtig, Daten nicht nur zu erfassen, sondern sie auch richtig zu interpretieren. Definieren Sie klare Ausgangswerte, legen Sie geeignete Alarmschwellenwerte fest und überwachen Sie aktiv, ob Abweichungen vorliegen. Wenn eine wichtige Metrik abweicht, insbesondere wenn sie mit anderen Daten korreliert, kann dies spezifische Problembereiche aufzeigen.

 Mit Beobachtbarkeit sind Sie besser in der Lage, potenzielle Herausforderungen vorherzusehen und zu bewältigen sowie sicherzustellen, dass Ihre Workload reibungslos funktioniert und den Geschäftsanforderungen entspricht. 

 AWS bietet spezielle Tools wie [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) für die Überwachung und Protokollierung sowie [AWS X-Ray](https://aws.amazon.com/xray/) für verteilte Ablaufverfolgung. Diese Services lassen sich mühelos in verschiedene AWS-Ressourcen integrieren und ermöglichen eine effiziente Datenerfassung, die Einrichtung von Warnmeldungen auf der Grundlage vordefinierter Schwellenwerte und die Darstellung von Daten auf Dashboards zur einfachen Interpretation. Durch die Nutzung dieser Erkenntnisse können Sie fundierte, datengestützte Entscheidungen treffen, die auf Ihre betrieblichen Ziele abgestimmt sind. 

**Topics**
+ [

# OPS08-BP01 Analysieren Sie Workload-Metriken
](ops_workload_observability_analyze_workload_metrics.md)
+ [

# OPS08-BP02 Analysieren Sie Workload-Protokolle
](ops_workload_observability_analyze_workload_logs.md)
+ [

# OPS08-BP03 Analysieren Sie Workload-Traces
](ops_workload_observability_analyze_workload_traces.md)
+ [

# OPS08-BP04 Erstellen umsetzbarer Warnmeldungen
](ops_workload_observability_create_alerts.md)
+ [

# OPS08-BP05 Erstellen von Dashboards
](ops_workload_observability_create_dashboards.md)

# OPS08-BP01 Analysieren Sie Workload-Metriken
OPS08-BP01 Analysieren Sie Workload-Metriken

 Analysieren Sie nach der Implementierung der Anwendungstelemetrie regelmäßig die gesammelten Metriken. Latenz, Anfragen, Fehler und Kapazität (oder Kontingente) liefern zwar Erkenntnisse zur Systemleistung, es ist jedoch wichtig, die Überprüfung der Metriken zu Geschäftsergebnissen zu priorisieren. Dadurch wird sichergestellt, dass Sie datengestützte Entscheidungen treffen, die auf Ihre Geschäftsziele abgestimmt sind. 

 **Gewünschtes Ergebnis:** Präzise Erkenntnisse zur Workload-Leistung, die als Grundlage für datengestützte Entscheidungen dienen und die Abstimmung mit den Geschäftszielen sicherstellen. 

 **Typische Anti-Muster:** 
+  Isolierte Analyse von Metriken, ohne deren Auswirkungen auf die Geschäftsergebnisse zu berücksichtigen. 
+  Übermäßiges Vertrauen in technische Metriken, während Geschäftsmetriken ignoriert werden. 
+  Seltene Überprüfung von Metriken, Entscheidungsmöglichkeiten in Echtzeit werden verpasst. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Verbessertes Verständnis des Zusammenhangs zwischen technischer Leistung und Geschäftsergebnissen. 
+  Verbesserter Entscheidungsprozess auf der Grundlage von Echtzeitdaten. 
+  Proaktive Identifizierung und Minderung von Problemen, bevor sie sich auf die Geschäftsergebnisse auswirken. 

 **Risikostufe bei fehlender Befolgung dieser bewährten Methode:** Mittel 

## Implementierungsleitfaden
Implementierungsleitfaden

 Nutzen Sie Tools wie Amazon CloudWatch , um metrische Analysen durchzuführen. AWS Dienste wie CloudWatch Anomalieerkennung und Amazon DevOps Guru können zur Erkennung von Anomalien verwendet werden, insbesondere wenn statische Schwellenwerte unbekannt sind oder wenn Verhaltensmuster besser für die Erkennung von Anomalien geeignet sind. 

### Implementierungsschritte
Implementierungsschritte

1.  **Analysieren und überprüfen:** Überprüfen Sie regelmäßig Ihre Workload-Metriken und werten Sie sie aus. 

   1.  Priorisieren Sie Metriken zu Geschäftsergebnissen gegenüber rein technischen. 

   1.  Machen Sie sich mit der Bedeutung von Spitzen, Rückgängen oder Mustern in Ihren Daten vertraut. 

1.  **Nutzen Sie Amazon CloudWatch:** Verwenden Sie Amazon CloudWatch für eine zentrale Ansicht und detaillierte Analysen. 

   1.  Konfigurieren Sie CloudWatch Dashboards, um Ihre Kennzahlen zu visualisieren und sie im Laufe der Zeit zu vergleichen. 

   1.  Verwenden Sie [Perzentile](https://aws-observability.github.io/observability-best-practices/guides/operational/business/sla-percentile/), CloudWatch um sich einen klaren Überblick über die Verteilung der Metriken zu verschaffen. Dies kann dazu beitragen, Ausreißer zu definieren SLAs und zu verstehen. 

   1.  Richten Sie die [Erkennung von CloudWatch Anomalien](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) ein, um ungewöhnliche Muster zu identifizieren, ohne sich auf statische Schwellenwerte verlassen zu müssen. 

   1.  Implementieren Sie [CloudWatch kontenübergreifende Beobachtbarkeit](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html), um Anwendungen zu überwachen und Fehler zu beheben, die sich über mehrere Konten innerhalb einer Region erstrecken. 

   1.  Verwenden Sie [CloudWatch Metric Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html), um Kennzahlen konten- und regionsübergreifend abzufragen und zu analysieren und Trends und Anomalien zu identifizieren. 

   1.  Wenden Sie [CloudWatch Metric Math](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/using-metric-math.html) an, um Ihre Kennzahlen zu transformieren, zu aggregieren oder zu berechnen, um tiefere Einblicke zu erhalten. 

1.  **Nutzen Sie Amazon DevOps Guru:** Integrieren Sie [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) für die durch maschinelles Lernen erweiterte Anomalieerkennung, um frühe Anzeichen von Betriebsproblemen Ihrer serverlosen Anwendungen zu erkennen und diese zu beheben, bevor sie sich auf Ihre Kunden auswirken. 

1.  **Optimieren Sie auf der Grundlage von Erkenntnissen:** Treffen Sie fundierte Entscheidungen auf der Grundlage Ihrer Metrikanalyse, um Ihre Workloads anzupassen und zu verbessern. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Implementieren Sie Anwendungstelemetrie](ops_observability_application_telemetry.md) 

 **Zugehörige Dokumente:** 
+ [ The Wheel Blog – Die Bedeutung der kontinuierlichen Überprüfung von Metriken ](https://aws.amazon.com/blogs/opensource/the-wheel/)
+ [ Perzentile sind wichtig ](https://aws-observability.github.io/observability-best-practices/guides/operational/business/sla-percentile/)
+ [Verwenden AWS Cost Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html)
+ [ CloudWatch kontenübergreifende Beobachtbarkeit](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html)
+ [Fragen Sie Ihre Metriken mit Metrics Insights ab CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html)

 **Zugehörige Videos:** 
+ [Kontoübergreifende Observability in Amazon aktivieren CloudWatch](https://www.youtube.com/watch?v=lUaDO9dqISc)
+ [Einführung in Amazon DevOps Guru](https://www.youtube.com/watch?v=2uA8q-8mTZY)
+ [Analysieren Sie kontinuierlich Metriken mit AWS Cost Anomaly Detection](https://www.youtube.com/watch?v=IpQYBuay5OE)

 **Zugehörige Beispiele:** 
+ [ Workshop zur Beobachtbarkeit ](https://catalog.workshops.aws/observability/en-US/intro)
+ [AIOpsMit Amazon DevOps Guru Einblicke in den Betrieb gewinnen](https://catalog.us-east-1.prod.workshops.aws/workshops/f92df379-6add-4101-8b4b-38b788e1222b/en-US)

# OPS08-BP02 Analysieren Sie Workload-Protokolle
OPS08-BP02 Analysieren Sie Workload-Protokolle

 Die regelmäßige Analyse von Workload-Protokollen ist unerlässlich, um ein tieferes Verständnis der operativen Aspekte Ihrer Anwendung zu erlangen. Durch effizientes Durchsuchen, Visualisieren und Interpretieren von Protokolldaten können Sie die Leistung und Sicherheit von Anwendungen kontinuierlich optimieren. 

 **Gewünschtes Ergebnis:** Umfassende Erkenntnisse zum Anwendungsverhalten und zu Operationen, die aus einer gründlichen Protokollanalyse gewonnen wurden und für eine proaktive Problemerkennung und -behebung sorgen. 

 **Typische Anti-Muster:** 
+  Die Analyse von Protokollen vernachlässigen, bis ein kritisches Problem auftritt. 
+  Die Suite verfügbarer Tools für die Protokollanalyse nicht nutzen und wichtige Erkenntnisse verpassen. 
+  Alleiniges Vertrauen auf die manuelle Überprüfung von Protokollen, ohne Automatisierungs- und Abfragefunktionen zu nutzen. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Proaktive Identifizierung von operativen Engpässen, Sicherheitsbedrohungen und anderen potenziellen Problemen. 
+  Effiziente Nutzung von Protokolldaten für die kontinuierliche Anwendungsoptimierung. 
+  Verbessertes Verständnis des Anwendungsverhaltens, Unterstützung beim Debuggen und bei der Problembehandlung. 

 **Risikostufe bei fehlender Befolgung dieser bewährten Methode:** Mittel 

## Implementierungsleitfaden
Implementierungsleitfaden

 [Amazon CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) ist ein leistungsstarkes Tool für die Protokollanalyse. Integrierte Funktionen wie CloudWatch Logs Insights und Contributor Insights machen das Ableiten aussagekräftiger Informationen aus Protokollen intuitiv und effizient. 

### Implementierungsschritte
Implementierungsschritte

1.  ** CloudWatch Protokolle einrichten**: Konfigurieren Sie Anwendungen und Dienste so, dass sie Protokolle an CloudWatch Logs senden. 

1.  **Verwenden Sie die Erkennung von Protokollanomalien:** Verwenden Sie die [Anomalieerkennung von Amazon CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/LogsAnomalyDetection.html), um ungewöhnliche Protokollmuster automatisch zu identifizieren und darauf hinzuweisen. Mit diesem Tool können Sie Anomalien in Ihren Protokollen proaktiv verwalten und potenzielle Probleme frühzeitig erkennen. 

1.  ** CloudWatch Logs Insights einrichten**: Verwenden Sie [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html), um Ihre Protokolldaten interaktiv zu suchen und zu analysieren. 

   1.  Erstellen Sie Abfragen, um Muster zu extrahieren, Protokolldaten zu visualisieren und umsetzbare Erkenntnisse abzuleiten. 

   1.  Verwenden Sie die [CloudWatch Logs Insights-Musteranalyse](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData_Patterns.html), um häufige Protokollmuster zu analysieren und zu visualisieren. Dieses Feature hilft Ihnen, allgemeine Betriebstrends und potenzielle Ausreißer in Ihren Protokolldaten nachzuvollziehen. 

   1.  Verwenden Sie [CloudWatch Logs compare (diff)](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData_Compare.html), um eine Differenzanalyse zwischen verschiedenen Zeiträumen oder zwischen verschiedenen Protokollgruppen durchzuführen. Verwenden Sie diese Funktion, um Änderungen zu lokalisieren und deren Auswirkungen auf die Leistung oder das Verhalten Ihres Systems zu bewerten. 

1.  **Überwachen Sie Protokolle in Echtzeit mit Live Tail:** Verwenden Sie [Amazon CloudWatch Logs Live Tail](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatchLogs_LiveTail.html), um Protokolldaten in Echtzeit anzuzeigen. Sie können die Betriebsaktivitäten Ihrer Anwendung in Echtzeit aktiv überwachen, um sich einen unmittelbaren Einblick in die Systemleistung und potenzielle Probleme zu verschaffen. 

1.  **Nutzen Sie Contributor Insights**: Verwenden Sie [CloudWatchContributor Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights.html), um Top-Talker in Dimensionen mit hoher Kardinalität wie IP-Adressen oder Benutzeragenten zu identifizieren. 

1.  **Implementieren Sie Metrikfilter für CloudWatch Logs: Konfigurieren Sie Metrikfilter** für [CloudWatch Logs, um Protokolldaten in umsetzbare Metriken](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) umzuwandeln. Auf diese Weise können Sie Alarme einstellen oder Muster näher analysieren. 

1.  **Implementieren Sie [CloudWatchkontenübergreifende Beobachtbarkeit](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html):** Überwachen Sie Anwendungen, die sich über mehrere Konten innerhalb einer Region erstrecken, und beheben Sie Fehler. 

1.  **Regelmäßige Überprüfung und Verfeinerung**: Überprüfen Sie regelmäßig Ihre Protokollanalysestrategien, um alle relevanten Informationen zu erfassen und die Anwendungsleistung kontinuierlich zu optimieren. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Implementieren Sie Anwendungstelemetrie](ops_observability_application_telemetry.md) 
+  [OPS08-BP01 Analysieren Sie Workload-Metriken](ops_workload_observability_analyze_workload_metrics.md) 

 **Zugehörige Dokumente:** 
+  [Analysieren von Protokolldaten mit CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) 
+  [ CloudWatch Contributor Insights verwenden](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights.html) 
+  [ CloudWatch Log-Metrikfilter erstellen und verwalten](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 

 **Zugehörige Videos:** 
+  [Analysieren Sie Protokolldaten mit CloudWatch Logs Insights](https://www.youtube.com/watch?v=2s2xcwm8QrM) 
+  [Verwenden Sie CloudWatch Contributor Insights, um Daten mit hoher Kardinalität zu analysieren](https://www.youtube.com/watch?v=ErWRBLFkjGI) 

 **Zugehörige Beispiele:** 
+  [CloudWatch Protokolliert Beispielabfragen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_QuerySyntax-examples.html) 
+  [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US/intro) 

# OPS08-BP03 Analysieren Sie Workload-Traces
OPS08-BP03 Analysieren Sie Workload-Traces

 Die Analyse von Trace-Daten ist entscheidend, wenn es darum geht, einen umfassenden Überblick über den Betriebsverlauf einer Anwendung zu erhalten. Durch die Visualisierung und das Verständnis der Interaktionen zwischen verschiedenen Komponenten können die Leistung optimiert, Engpässe identifiziert und das Benutzererlebnis verbessert werden. 

 **Gewünschtes Ergebnis:** Sie verschaffen sich einen klaren Überblick über die verteilten Abläufe Ihrer Anwendung und erzielen dadurch eine schnellere Problemlösung und eine verbesserte Benutzererfahrung. 

 **Typische Anti-Muster:** 
+  Trace-Daten werden übersehen und man verlässt sich ausschließlich auf Protokolle und Metriken. 
+  Trace-Daten werden nicht mit zugehörigen Protokollen in Zusammenhang gebracht. 
+  Aus Traces abgeleitete Metriken wie Latenz und Fehlerraten werden ignoriert. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Verbessern Sie die Problembehandlung und reduzieren Sie die durchschnittliche Zeit bis zur Problemlösung (). MTTR 
+  Sie gewinnen Erkenntnisse über Abhängigkeiten und deren Auswirkungen. 
+  Sie können Leistungsprobleme rasch identifizieren und beheben. 
+  Sie nutzen von aus Trace abgeleitete Metriken für fundierte Entscheidungen. 
+  Sie erzielen ein besseres Benutzererlebnis durch optimierte Komponenteninteraktionen. 

 **Risikostufe bei fehlender Befolgung dieser bewährten Methode:** Mittel 

## Implementierungsleitfaden
Implementierungsleitfaden

 [AWS X-Ray](https://www.docs.aws.com/xray/latest/devguide/aws-xray.html) bietet eine umfassende Suite für die Analyse von Trace-Daten, die einen ganzheitlichen Überblick über Serviceinteraktionen, die Überwachung von Benutzeraktivitäten und die Erkennung von Leistungsproblemen bietet. Funktionen wie ServiceLens X-Ray Insights, X-Ray Analytics und Amazon DevOps Guru erweitern die Tiefe verwertbarer Erkenntnisse, die aus Trace-Daten gewonnen werden. 

### Implementierungsschritte
Implementierungsschritte

 Die folgenden Schritte bieten einen strukturierten Ansatz zur effektiven Implementierung der Analyse von Spurendaten mithilfe von AWS Services: 

1.  **Integrieren AWS X-Ray**: Stellen Sie sicher, dass X-Ray in Ihre Anwendungen integriert ist, um Trace-Daten zu erfassen. 

1.  **Analyse von X-Ray-Metriken**: Untersuchen Sie anhand von X-Ray-Traces abgeleitete Metriken wie Latenz, Anfrageraten, Fehlerraten und Antwortzeitverteilungen mithilfe der [Service-Übersicht](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-servicemap.html#xray-console-servicemap-view), um den Status der Anwendung zu überwachen. 

1.  **Verwendung ServiceLens**: Nutzen Sie die [ServiceLensKarte](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/servicelens_service_map.html), um die Sichtbarkeit Ihrer Dienste und Anwendungen zu verbessern. Dies ermöglicht eine integrierte Anzeige von Traces, Metriken, Protokollen, Alarmen und anderen Statusinformationen. 

1.  **Aktivieren von X-Ray-Insights**: 

   1.  Aktivieren Sie [X-Ray-Insights](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) zur automatisierten Erkennung von Anomalien in Traces. 

   1.  Untersuchen Sie Erkenntnisse, um Muster zu identifizieren und die Ursachen zu ermitteln, z. B. erhöhte Fehlerraten oder Latenzen. 

   1.  Eine chronologische Analyse der erkannten Probleme finden Sie in der Insights-Timeline. 

1.  **Verwenden von X-Ray Analytics**: [X-Ray Analytics](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) ermöglicht es Ihnen, Trace-Daten gründlich zu untersuchen, Muster zu lokalisieren und Erkenntnisse zu gewinnen. 

1.  **Verwenden von Gruppen in X-Ray**: Erstellen Sie Gruppen in X-Ray, um Traces nach Kriterien wie hoher Latenz zu filtern und so eine gezieltere Analyse zu ermöglichen. 

1.  **Integrieren Sie Amazon DevOps Guru**: Nutzen Sie [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/), um von Modellen für maschinelles Lernen zu profitieren, mit denen betriebliche Anomalien in Spuren lokalisiert werden können. 

1.  **Verwenden Sie CloudWatch Synthetics**: Verwenden Sie [CloudWatchSynthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_tracing.html), um Kanarien für die kontinuierliche Überwachung Ihrer Endpunkte und Workflows zu erstellen. Sie können diese Canarys in X-Ray integrieren, um Trace-Daten für eine eingehende Analyse der getesteten Anwendungen bereitzustellen. 

1.  **Verwenden Sie Real User Monitoring (RUM)**: Mit [AWS X-Ray und](https://docs.aws.amazon.com/xray/latest/devguide/xray-services-RUM.html) können Sie den Anforderungspfad analysieren und debuggen CloudWatch RUM, angefangen bei den Endbenutzern Ihrer Anwendung bis hin zu nachgeschalteten Managed Services. AWS Auf diese Weise können Sie Latenztrends und Fehler identifizieren, die sich auf Ihre Endbenutzer auswirken. 

1.  **Korrelieren von Daten mit Protokollen:**: Bringen Sie [Trace-Daten mit zugehörigen Protokollen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/servicelens_troubleshooting.html#servicelens_troubleshooting_Nologs) innerhalb der X-Ray-Trace-Ansicht in Zusammenhang, um eine detaillierte Perspektive auf das Anwendungsverhalten zu erhalten. Auf diese Weise können Sie Protokollereignisse anzeigen, die direkt mit verfolgten Transaktionen verknüpft sind. 

1.  **Implementieren Sie [CloudWatchkontenübergreifende Beobachtbarkeit](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html):** Überwachen Sie Anwendungen, die sich über mehrere Konten innerhalb einer Region erstrecken, und beheben Sie Fehler. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS08-BP01 Analysieren Sie Workload-Metriken](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Analysieren Sie Workload-Protokolle](ops_workload_observability_analyze_workload_logs.md) 

 **Zugehörige Dokumente:** 
+  [Verwendung ServiceLens zur Überwachung des Anwendungszustands](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ServiceLens.html) 
+  [Erkunden von Trace-Daten mit X-Ray Analytics](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) 
+  [Mit X-Ray-Insights Anomalien in Traces erkennen](https://docs.aws.amazon.com/xray/latest/devguide/xray-insights.html) 
+  [Kontinuierliche Überwachung mit CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 

 **Zugehörige Videos:** 
+  [Analysieren und Debuggen von Anwendungen mit Amazon CloudWatch Synthetics & AWS X-Ray](https://www.youtube.com/watch?v=s2WvaV2eDO4) 
+  [Nutzung von AWS X-Ray -Insights](https://www.youtube.com/watch?v=tl8OWHl6jxw) 

 **Zugehörige Beispiele:** 
+  [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US/intro) 
+  [Implementierung von X-Ray mit AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/services-xray.html) 
+  [CloudWatchSynthetics Canary Schablonen](https://github.com/aws-samples/cloudwatch-synthetics-canary-terraform) 

# OPS08-BP04 Erstellen umsetzbarer Warnmeldungen
OPS08-BP04 Erstellen umsetzbarer Warnmeldungen

 Es ist entscheidend, Abweichungen im Verhalten Ihrer Anwendung umgehend zu erkennen und darauf zu reagieren. Besonders wichtig ist es, zu erkennen, wann die auf den wichtigsten Leistungsindikatoren (KPIs) basierenden Ergebnisse gefährdet sind oder unerwartete Anomalien auftreten. Wenn Sie Warnmeldungen auf KPIs basieren, stellen Sie dadurch sicher, dass die Signale, die Sie erhalten, direkt mit geschäftlichen oder betrieblichen Auswirkungen verknüpft sind. Der Ansatz mit umsetzbaren Warnmeldungen fördert proaktive Reaktionen und trägt zur Aufrechterhaltung der Systemleistung und Zuverlässigkeit bei. 

 **Gewünschtes Ergebnis:** Sie erhalten rechtzeitig relevante und umsetzbare Warnmeldungen, um potenzielle Probleme schnell zu erkennen und zu beheben, insbesondere wenn die KPI-Ergebnisse gefährdet sind. 

 **Typische Anti-Muster:** 
+  Es werden zu viele unkritische Warnmeldungen eingerichtet, was zu einer Alarmmüdigkeit führt. 
+  Warnmeldungen werden nicht anhand von KPIs priorisiert, was es schwierig macht, die geschäftlichen Auswirkungen von Problemen zu verstehen. 
+  Die eigentlichen Ursachen werden vernachlässigt, was zu wiederholten Warnmeldungen für dasselbe Problem führt. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Geringere Alarmermüdung durch Fokussierung auf umsetzbare und relevante Warnmeldungen. 
+  Verbesserte Systemverfügbarkeit und -zuverlässigkeit durch proaktive Problemerkennung und -behebung. 
+  Verbesserte Teamzusammenarbeit und schnellere Problemlösung durch die Integration in übliche Alarmierungs- und Kommunikationstools. 

 **Risikostufe bei fehlender Befolgung dieser bewährten Methode:** Hoch 

## Implementierungsleitfaden
Implementierungsleitfaden

 Um einen effektiven Warnmechanismus zu schaffen, ist es wichtig, Metriken, Protokolle und Trace-Daten zu verwenden, die darauf hinweisen, wenn auf KPIs basierende Ergebnisse gefährdet sind oder Anomalien erkannt werden. 

### Implementierungsschritte
Implementierungsschritte

1.  **Festlegen der wichtigsten Leistungskennzahlen (KPIs)**: Identifizieren Sie die KPIs Ihrer Anwendung. Warnmeldungen sollten mit diesen KPIs verknüpft werden, damit sie die Auswirkungen auf das Unternehmen genau widerspiegeln. 

1.  **Implementierung der Erkennung von Anomalien**: 
   +  **Verwenden von Amazon CloudWatch-Anomalieerkennung**: Richten Sie die [Amazon CloudWatch-Anomalieerkennung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) so ein, dass ungewöhnliche Muster automatisch erkannt werden. So werden nur Warnmeldungen für echte Anomalien generiert. 
   +  **Nutzung von AWS X-Ray-Insights**: 

     1.  Richten Sie [X-Ray-Insights](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) ein, um Anomalien in Trace-Daten zu erkennen. 

     1.  Konfigurieren Sie [Benachrichtigungen für X-Ray-Insights](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications), um bei erkannten Problemen gewarnt zu werden. 
   +  **Integration mit Amazon DevOps Guru**: 

     1.  Nutzen Sie [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) für seine Machine-Learning-Funktionen für die Erkennung betrieblicher Anomalien anhand vorhandener Daten. 

     1.  Navigieren Sie zu den [Benachrichtigungseinstellungen](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings) in DevOps Guru, um Warnmeldungen über Anomalien einzurichten. 

1.  **Implementieren umsetzbarer Warnmeldungen**: Entwerfen Sie Warnmeldungen, die angemessene Informationen für sofortige Maßnahmen liefern. 

   1.  Überwachen Sie [AWS Health-Ereignisse mit Amazon-EventBridge-Regeln](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html) oder integrieren Sie sie programmatisch mit der AWS Health API, um Aktionen zu automatisieren, wenn Sie AWS Health-Ereignisse empfangen. Dies können allgemeine Aktionen sein, z. B. das Senden aller geplanten Lebenszyklus-Ereignisnachrichten an eine Chat-Oberfläche, oder spezifische Aktionen, wie das Initiieren eines Workflows in einem IT-Servicemanagement-Tool. 

1.  **Verringern der Alarmmüdigkeit**: Minimieren Sie die Zahl der Warnmeldungen, die nicht kritisch sind. Wenn Teams mit zahllosen unbedeutenden Warnmeldungen überfordert werden, können sie den Überblick über kritische Probleme verlieren, was die Gesamteffektivität des Warnmechanismus beeinträchtigt. 

1.  **Einrichten zusammengesetzter Alarme**: Verwenden Sie [zusammengesetzte Alarme in Amazon CloudWatch](https://aws.amazon.com/bloprove-monitoring-efficiency-using-amazon-cloudwatch-composite-alarms-2/), um mehrere Alarme zu konsolidieren. 

1.  **Integration mit Warnmeldungs-Tools**: Integrieren Sie Tools wie [Ops Genie](https://www.atlassian.com/software/opsgenie) und [PagerDuty](https://www.pagerduty.com/). 

1.  **Einbinden von Amazon Q Developer in Chat-Anwendungen**: Integration von [Amazon Q Developer in Chat-Anwendungen](https://aws.amazon.com/chatbot/) zur Weiterleitung von Warnungen an Amazon Chime, Microsoft Teams und Slack. 

1.  **Auf Protokollen basierende Warnungen**: Verwenden Sie [metrische Protokollfilter](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) in CloudWatch, um Alarme auf der Grundlage bestimmter Protokollereignisse zu erstellen. 

1.  **Überprüfen und wiederholen**: Überprüfen und verfeinern Sie die Warnkonfigurationen regelmäßig. 

 **Aufwand für den Implementierungsplan:** Mittel 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Implementieren Sie Anwendungstelemetrie](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Implementieren Sie Benutzererlebnis-Telemetrie](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Implementieren Sie verteiltes Tracing](ops_observability_dist_trace.md) 
+  [OPS08-BP01 Analysieren Sie Workload-Metriken](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Analysieren Sie Workload-Protokolle](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Analysieren Sie Workload-Traces](ops_workload_observability_analyze_workload_traces.md) 

 **Zugehörige Dokumente:** 
+  [Verwenden von Amazon-CloudWatch-Alarmen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Erstellen eines zusammengesetzten Alarms](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html) 
+  [Erstellen eines CloudWatch-Alarms basierend auf Anomalieerkennung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) 
+  [DevOps Guru Notifications](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html) 
+  [X-ray insights notifications](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) 
+  [Überwachung, Betrieb und Fehlerbehebung Ihrer AWS-Ressourcen mit interaktiven ChatOps](https://aws.amazon.com/chatbot/) 
+  [Amazon CloudWatch Integration Guide \$1 PagerDuty](https://support.pagerduty.com/docs/amazon-cloudwatch-integration-guide) 
+  [Integrate Opsgenie with Amazon CloudWatch](https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-amazon-cloudwatch/) 

 **Zugehörige Videos:** 
+  [Create Composite Alarms in Amazon CloudWatch](https://www.youtube.com/watch?v=0LMQ-Mu-ZCY) 
+  [Überblick über Amazon Q Developer in Chat-Anwendungen](https://www.youtube.com/watch?v=0jUSEfHbTYk) 
+  [AWS On Air ft. Mutative Befehle in Amazon Q Developer in Chat-Anwendungen](https://www.youtube.com/watch?v=u2pkw2vxrtk) 

 **Zugehörige Beispiele:** 
+  [Alarme, Vorfallmanagement und Problembehebung in der Cloud mit Amazon CloudWatch](https://aws.amazon.com/bloarms-incident-management-and-remediation-in-the-cloud-with-amazon-cloudwatch/) 
+  [Tutorial: Erstellen einer Amazon-EventBridge-Regel, die Benachrichtigungen an Amazon Q Developer in Chat-Anwendungen sendet](https://docs.aws.amazon.com/chatbot/latest/adminguide/create-eventbridge-rule.html) 
+  [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US/intro) 

# OPS08-BP05 Erstellen von Dashboards
OPS08-BP05 Erstellen von Dashboards

 Dashboards sind die anwenderorientierte Sicht auf die Telemetriedaten Ihrer Workloads. Sie stellen zwar eine wichtige visuelle Schnittstelle dar, sollten aber nicht als Ersatz, sondern als Ergänzung für Warnmechanismen dienen. Wenn sie sorgfältig zusammengestellt werden, liefern sie nicht nur schnelle Erkenntnisse zum Status und zur Leistung des Systems, sondern bieten Stakeholdern auch Echtzeitinformationen über Geschäftsergebnisse und die Auswirkungen von Problemen. 

 **Gewünschtes Ergebnis:** 

 Klare, umsetzbare Erkenntnisse zur System- und Geschäftsstabilität mithilfe visueller Darstellungen. 

 **Typische Anti-Muster:** 
+  Überkomplizierte Dashboards mit zu vielen Metriken. 
+  Sich auf Dashboards verlassen, ohne Warnmeldungen zur Erkennung von Anomalien zu nutzen. 
+  Fehlende Aktualisierung der Dashboards im Laufe des Workload-Fortschritts. 

 **Vorteile dieser bewährten Methode:** 
+  Sofortiger Einblick in wichtige Systemmetriken und KPIs. 
+  Verbesserte Kommunikation und mehr Verständnis unter den Stakeholdern. 
+  Rasche Erkenntnisse zu den Auswirkungen operativer Probleme. 

 **Risikostufe bei fehlender Befolgung dieser bewährten Methode:** Mittel 

## Implementierungsleitfaden
Implementierungsleitfaden

 **Geschäftsorientierte Dashboards** 

 Dashboards, die auf Geschäfts-KPIs zugeschnitten sind, sprechen ein breiteres Spektrum von Stakeholdern an. Auch wenn diese Personen vielleicht nicht an Systemmetriken interessiert sind, haben sie dennoch großes Interesse daran, die geschäftlichen Auswirkungen dieser Zahlen zu verstehen. Ein geschäftsorientiertes Dashboard stellt sicher, dass alle technischen und betrieblichen Metriken, die überwacht und analysiert werden, auf die übergeordneten Geschäftsziele ausgerichtet sind. Diese Ausrichtung sorgt für Klarheit und stellt sicher, dass alle gleich darüber informiert sind, was wichtig ist und was nicht. Darüber hinaus sind Dashboards, die Geschäfts-KPIs hervorheben, in der Regel leichter umzusetzen. Sie bieten Stakeholdern die Möglichkeit, in kürzester Zeit den Status der Abläufe, die Bereiche, die Aufmerksamkeit erfordern, und die potenziellen Auswirkungen auf die Geschäftsergebnisse zu verstehen. 

 Vor diesem Hintergrund sollten Sie bei der Erstellung Ihrer Dashboards sicherstellen, dass ein Gleichgewicht zwischen technischen Metriken und Geschäfts-KPIs besteht. Beide sind wichtig, richten sich aber an unterschiedliche Zielgruppen. Idealerweise sollten Sie über Dashboards verfügen, die einen ganzheitlichen Überblick über den Status und die Leistung des Systems bieten und gleichzeitig wichtige Geschäftsergebnisse und deren Auswirkungen hervorheben. 

 Amazon-CloudWatch-Dashboards sind anpassbare Startseiten in der CloudWatch-Konsole, mit denen Sie Ihre Ressourcen in einer einzigen Ansicht überwachen können, auch solche, die über verschiedene AWS-Regionen und Konten verteilt sind. 

### Implementierungsschritte
Implementierungsschritte

1.  **Erstellen eines grundlegenden Dashboards:** [Erstellen Sie ein neues Dashboard in CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/create_dashboard.html) und geben Sie ihm einen aussagekräftigen Namen. 

1.  **Verwenden von Markdown-Widgets:** Bevor Sie sich mit den Metriken befassen, [verwenden Sie Markdown-Widgets](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_remove_text_dashboard.html), um Ihr Dashboard oben mit Kontext zu versehen. Dieser sollte den Inhalt des Dashboards beschreiben und angeben, welche Bedeutung den dargestellten Metriken zukommt. Er kann auch Links zu anderen Dashboards und Tools zur Fehlerbehebung enthalten. 

1.  **Erstellen von Dashboard-Variablen:** [Integrieren Sie gegebenenfalls Dashboard-Variablen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_dashboard_variables.html), um dynamische und flexible Dashboard-Ansichten zu ermöglichen. 

1.  **Erstellen von Metrik-Widgets:** [Fügen Sie Metrik-Widgets hinzu](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/create-and-work-with-widgets.html), um verschiedene Metriken zu visualisieren, die Ihre Anwendung ausgibt, und passen Sie diese Widgets so an, dass sie den Systemstatus und die Geschäftsergebnisse effektiv darstellen. 

1.  **Verwenden von Log-Insights-Abfragen:** Verwenden Sie [CloudWatch Log Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_ExportQueryResults.html), um umsetzbare Metriken aus Ihren Protokollen abzurufen und diese Erkenntnisse auf Ihrem Dashboard anzuzeigen. 

1.  **Einrichten von Alarmen:** Integrieren Sie [CloudWatch-Alarme](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_remove_alarm_dashboard.html) in Ihr Dashboard, um einen raschen Überblick über alle Metriken zu erhalten, die ihre Schwellenwerte überschreiten. 

1.  **Verwenden von Contributor Insights:** Integrieren Sie [CloudWatch Contributor Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights-ViewReports.html), um Felder mit hoher Kardinalität zu analysieren und ein besseres Verständnis der wichtigsten Mitwirkenden Ihrer Ressource zu erhalten. 

1.  **Entwerfen benutzerdefinierter Widgets:** Für spezielle Anforderungen, die von Standard-Widgets nicht erfüllt werden, sollten Sie es in Betracht ziehen, [benutzerdefinierte Widgets](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_custom_widget_dashboard.html) zu erstellen. Diese können Daten aus verschiedenen Datenquellen abrufen oder sie auf spezifische Weise darstellen. 

1.  **Verwenden von AWS Health:** AWS Health ist die autoritative Informationsquelle für den Zustand Ihrer AWS Cloud-Ressourcen. Verwenden Sie [AWS Health Dashboard](https://health.aws.amazon.com/health/status) unverändert oder verwenden Sie AWS Health-Daten in Ihren eigenen Dashboards und Tools, damit Sie die richtigen Informationen zur Verfügung haben, um fundierte Entscheidungen zu treffen. 

1.  **Wiederholen und optimieren:** Im Laufe der Entwicklung Ihrer Anwendung sollten Sie Ihr Dashboard regelmäßig überprüfen, um sicherzustellen, dass es weiterhin relevant ist. 

## Ressourcen
Ressourcen

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Identifizieren Sie die wichtigsten Leistungsindikatoren](ops_observability_identify_kpis.md) 
+  [OPS08-BP01 Analysieren Sie Workload-Metriken](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Analysieren Sie Workload-Protokolle](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Analysieren Sie Workload-Traces](ops_workload_observability_analyze_workload_traces.md) 
+  [OPS08-BP04 Erstellen umsetzbarer Warnmeldungen](ops_workload_observability_create_alerts.md) 

 **Zugehörige Dokumente:** 
+  [Erstellung von Dashboards für operative Sichtbarkeit](https://aws.amazon.com/builders-library/building-dashboards-for-operational-visibility/) 
+  [Amazon CloudWatch Dashboards verwenden](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 

 **Zugehörige Videos:** 
+  [Konto- und regionenübergreifende CloudWatch-Dashboards erstellen](https://www.youtube.com/watch?v=eIUZdaqColg) 
+  [AWS re:Invent 2021 - Gain enterprise visibility with AWS Cloud operation dashboards)](https://www.youtube.com/watch?v=NfMpYiGwPGo) 

 **Zugehörige Beispiele:** 
+  [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US/intro) 
+  [Anwendungsüberwachung mit Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/application-monitoring-with-cloudwatch/) 
+  [Dashboards und Einblicke zu AWS Health Events Intelligence](https://aws.amazon.com/blogs/mt/aws-health-events-intelligence-dashboards-insights/) 
+  [Visualisieren von AWS Health-Ereignissen mit Amazon Managed Grafana](https://aws.amazon.com/blogs/mt/visualize-aws-health-events-using-amazon-managed-grafana/) 