# OPS 8 Wie können Sie den Zustand Ihres Workloads beurteilen?
<a name="ops-08"></a>

 Definieren, erfassen und analysieren Sie Workload-Metriken, um einen Einblick in Workload-Ereignisse zu erhalten. Dies ist wichtig, damit Sie bei Bedarf entsprechende Maßnahmen ergreifen können. 

**Topics**
+ [OPS08-BP01 Ermitteln wichtiger Leistungskennzahlen](ops_workload_health_define_workload_kpis.md)
+ [OPS08-BP02 Definieren von Workload-Metriken](ops_workload_health_design_workload_metrics.md)
+ [OPS08-BP03 Erfassen und Analysieren von Workload-Metriken](ops_workload_health_collect_analyze_workload_metrics.md)
+ [OPS08-BP04 Festlegen von Ausgangswerten für Workload-Metriken](ops_workload_health_workload_metric_baselines.md)
+ [OPS08-BP05 Lernen erwarteter Aktivitätsmuster für den Workload](ops_workload_health_learn_workload_usage_patterns.md)
+ [OPS08-BP06 Alarm bei gefährdeten Workload-Ergebnissen](ops_workload_health_workload_outcome_alerts.md)
+ [OPS08-BP07 Alarm bei festgestellten Workload-Anomalien](ops_workload_health_workload_anomaly_alerts.md)
+ [OPS08-BP08 Prüfen der Erreichung von angestrebten Ergebnissen und der Wirksamkeit von KPIs und Metriken](ops_workload_health_biz_level_view_workload.md)

# OPS08-BP01 Ermitteln wichtiger Leistungskennzahlen
<a name="ops_workload_health_define_workload_kpis"></a>

 Identifizieren Sie wichtige Leistungskennzahlen (KPIs) anhand der gewünschten Geschäftsergebnisse (z. B. Auftragsrate, Kundenbindungsrate und Gewinn im Vergleich zu Betriebsausgaben) und Kundenergebnisse (z. B. Kundenzufriedenheit). Bewerten Sie zur Messung des Workload-Erfolgs KPIs. 

 **Gängige Antimuster:** 
+  Sie werden von der Geschäftsleitung gefragt, wie erfolgreich ein Workload die Geschäftsanforderungen erfüllt, haben aber keinen Referenzrahmen, um den Erfolg zu bestimmen. 
+  Sie können nicht feststellen, ob die kommerzielle Standardanwendung, die Sie für Ihr Unternehmen betreiben, kostengünstig ist. 

 **Vorteile der Einführung dieser bewährten Methode:** Durch die Ermittlung wichtiger Leistungskennzahlen ermöglichen Sie das Erreichen von Geschäftsergebnissen als Test des Workload-Zustands und -Erfolgs. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Ermitteln wichtiger Leistungskennzahlen: Ermitteln Sie auf Basis der gewünschten geschäftlichen und kundenspezifischen Ergebnisse wichtige Leistungskennzahlen (Key Performance Indicators, KPIs). Bewerten Sie zur Messung des Workload-Erfolgs KPIs. 

# OPS08-BP02 Definieren von Workload-Metriken
<a name="ops_workload_health_design_workload_metrics"></a>

Definieren Sie Metriken, die den Zustand des Workloads erfassen. Der Zustand des Workloads wird durch das Erreichen von Geschäftsergebnissen (KPIs) und den Zustand der Workload-Komponenten und -Anwendungen bestimmt. Beispiele für KPIs sind abgebrochene Einkäufe, getätigte Bestellungen, Kosten, Preise und dem Workload zugeordnete Ausgaben. Sie können Telemetriedaten von mehreren Komponenten erfassen. Sie sollten jedoch eine Teilmenge auswählen, die Erkenntnisse über den gesamten Zustand des Workloads liefert. Passen Sie die Metriken für den Workload kontinuierlich an die sich ändernden Geschäftsanforderungen an. 

 **Gewünschtes Ergebnis:** 
+  Sie haben Metriken identifiziert, die validieren, dass für die Geschäftsergebnisse relevante KPIs erreicht wurden. 
+  Sie verfügen über Metriken, die einen konsistenten Überblick über den Zustand des Workloads geben. 
+  Die Metriken für den Workload werden bei veränderten Geschäftsanforderungen regelmäßig überprüft. 

 **Typische Anti-Muster:** 
+ Sie überwachen alle Anwendungen in Ihrem Workload, können aber nicht feststellen, ob Ihr Workload die Geschäftsergebnisse erreicht.
+ Sie haben zwar Metriken für den Workload definiert, diese sind jedoch keinen geschäftlichen KPIs zugeordnet.

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Sie können Ihren Workload an der Erreichung von Geschäftsergebnissen bewerten. 
+  Sie wissen, ob sich Ihr Workload in einem gesunden Zustand befindet oder ob Sie eingreifen müssen. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Das Ziel dieser bewährten Methode ist, dass Sie die folgende Frage beantworten können: Befindet sich mein Workload in einem guten Zustand? Der Zustand des Workloads wird durch das Erreichen der Geschäftsziele und den Zustand der Anwendungen und Komponenten im Workload definiert. Arbeiten Sie ausgehend von geschäftlichen KPIs rückwärts, um Metriken zu ermitteln. Ermitteln Sie die Schlüsselmetriken von Komponenten und Anwendungen. Überprüfen Sie bei Veränderungen der geschäftlichen Anforderungen regelmäßig die Metriken des Workloads. 

 **Kundenbeispiel** 

 Der Zustand des Workloads wird bei AnyCompany Retail durch die Erfassung von Metriken für Anwendungen und Komponenten bestimmt. Ausgehend von den geschäftlichen KPIs werden Metriken wie die Bestellrate ermittelt, die zeigen, ob die Geschäftsergebnisse erreicht werden. Dazu gehören auch wichtige Metriken für Anwendungen wie die Antwortzeiten der Seiten und für Komponenten wie die Anzahl der offenen Datenbankverbindungen. Vierteljährlich werden die Metriken für den Workload neu bewertet, um sicherzustellen, dass sie weiterhin zur Bestimmung des Zustands des Workloads geeignet sind. 

 **Implementierungsschritte** 

1.  Starten Sie mit den geschäftlichen KPIs und ermitteln Sie Metriken, die zeigen, dass Sie die Geschäftsergebnisse erreichen. Wenn es KPIs ohne Metriken gibt, versehen Sie Ihren Workload mit zusätzlichen Metriken für fehlende geschäftliche KPIs. 

   1.  Sie können angepasste Metriken aus Ihren Anwendungen in [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) veröffentlichen. 

   1.  Die [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) kann Metriken aus bestehenden Anwendungen erfassen und zum Hinzufügen neuer Metriken verwendet werden. 

   1.  Kunden mit Enterprise Support können den [Building a Monitoring Strategy Workshop](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) (Aufbau einer Überwachungsstrategie) bei ihrem Technical Account Manager anfordern. Dieser Workshop hilft Ihnen bei der Entwicklung einer Überwachungsstrategie für Ihren Workload. 

1.  Identifizieren Sie Metriken für Anwendungen und Komponenten im Workload. Was sind die wichtigsten Metriken, die den Zustand der einzelnen Komponenten und Anwendungen abbilden? Anwendungen und Komponenten können viele verschiedene Metriken liefern. Wählen Sie eine bis drei Schlüsselmetriken aus, die den Gesamtzustand des Systems abbilden. 

1.  Implementieren Sie einen Mechanismus zur regelmäßigen Bewertung der Workload-Metriken. Arbeiten Sie mit Stakeholdern zusammen, um die Workload-Metriken bei Änderungen der geschäftlichen KPIs zu aktualisieren. Passen Sie Ihre Workload-Metriken an, wenn sich Ihre Workload-Komponenten und Anwendungen weiterentwickeln. 

 **Grad des Aufwands für den Implementierungsplan:** mittel. Das Hinzufügen von Metriken für geschäftliche KPIs zu Anwendungen kann einen moderaten Aufwand darstellen. 

## Ressourcen
<a name="resources"></a>

 **Zugehörige bewährte Methoden:** 
+  [OPS04-BP01 Implementieren einer Anwendungstelemetrie](ops_telemetry_application_telemetry.md) - Ihre Anwendung muss Telemetriedaten liefern, die die Geschäftsergebnisse unterstützen. 
+  [OPS04-BP02 Implementieren und Konfigurieren der Workload-Telemetrie](ops_telemetry_workload_telemetry.md) - Sie müssen Ihren Workload so einrichten, dass er Telemetriedaten liefert, bevor Sie Workload-Metriken für Geschäftsergebnisse definieren können. 
+  [OPS08-BP01 Ermitteln wichtiger Leistungskennzahlen](ops_workload_health_define_workload_kpis.md) - Bevor Sie Workload-Metriken auswählen, müssen Sie zunächst die wichtigsten Leistungsindikatoren ermitteln. 

 **Zugehörige Dokumente:** 
+ [ Adding metrics and traces to your application on Amazon EKS with AWS Distro for OpenTelemetry, AWS X-Ray, and Amazon CloudWatch ](https://aws.amazon.com/blogs/mt/adding-metrics-and-traces-to-your-application-on-amazon-eks-with-aws-distro-for-opentelemetry-aws-x-ray-and-amazon-cloudwatch/) (Hinzufügen von Metriken und Traces zu Ihrer Anwendung in Amazon EKS mit der AWS Distro for OpenTelemetry, Amazon X-Ray und Amazon CloudWatch)
+ [Instrumentieren verteilter Systeme für Einblicke in die Betriebsabläufe](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/)
+ [Implementieren von Zustandsprüfungen](https://aws.amazon.com/builders-library/implementing-health-checks/)
+ [Effektives Überwachen Ihrer Anwendungen](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/)
+ [ How to better monitor your custom application metrics using Amazon CloudWatch Agent ](https://aws.amazon.com/blogs/devops/new-how-to-better-monitor-your-custom-application-metrics-using-amazon-cloudwatch-agent/) (So können Sie die Metriken Ihrer angepassten Anwendung mit dem Amazon CloudWatch-Agent besser überwachen)

 **Zugehörige Videos:** 
+ [AWS re:Invent 2020: Monitoring production services at Amazon ](https://www.youtube.com/watch?v=hnPcf_Czbvw) (AWS re:Invent 2020: Überwachung von Produktionsservices bei Amazon)
+ [AWS re:Invent 2022 – Building observable applications with OpenTelemetry (BOA310) ](https://www.youtube.com/watch?v=efk8XFJrW2c) (AWS re:Invent 2022 – Entwicklung überwachbarer Anwendungen mit OpenTelemetry (BOA310))
+ [ How to Easily Setup Application Monitoring for Your AWS Workloads (So richten Sie die Anwendungsüberwachung mühelos für Ihre AWS-Workloads ein) – AWS Online Tech Talks ](https://www.youtube.com/watch?v=LKCth30RqnA)
+ [ Mastering Observability of Your Serverless Applications (Beherrschung der Beobachtbarkeit Ihrer serverlosen Anwendungen) – AWS Online Tech Talks ](https://www.youtube.com/watch?v=CtsiXhiAUq8)

 **Zugehörige Beispiele:** 
+ [Workshop zur Beobachtbarkeit](https://catalog.workshops.aws/observability/en-US/intro)

 **Zugehörige Services:** 
+ [ Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [AWS Distro for OpenTelemetry ](https://aws-otel.github.io/)

# OPS08-BP03 Erfassen und Analysieren von Workload-Metriken
<a name="ops_workload_health_collect_analyze_workload_metrics"></a>

Führen Sie regelmäßige, proaktive Überprüfungen von Workload-Metriken durch, um Trends zu erkennen und festzustellen, ob eine Reaktion erforderlich ist. Validieren Sie das Erreichen von Geschäftsergebnissen. Erfassen Sie Metriken aus Ihren Workload-Anwendungen und -Komponenten an einem zentralen Ort. Verwenden Sie Dashboards und Analytik-Tools, um die Telemetriedaten zu analysieren und den Zustand des Workloads zu bestimmen. Implementieren Sie einen Mechanismus zur regelmäßigen Überprüfung des Workload-Zustands mit den Stakeholdern in Ihrer Organisation. 

 **Gewünschtes Ergebnis:** 
+  Workload-Metriken werden an einem zentralen Ort gesammelt. 
+  Dashboards und Analytik-Tools werden zur Analyse von Trends im Zustand des Workloads verwendet. 
+  Sie führen regelmäßige Überprüfungen der Workload-Metriken mit Ihrer Organisation durch. 

 **Typische Anti-Muster:** 
+  Ihre Organisation erfasst Metriken des Workloads auf zwei verschiedenen Überwachungsplattformen. Sie sind nicht in der Lage, den Zustand des Workloads zu ermitteln, da die Plattformen nicht kompatibel sind. 
+  Die Fehlerraten für eine Komponente Ihres Workloads steigen langsam an. Sie bemerken diesen Trend nicht, weil Ihre Organisation keine regelmäßigen Überprüfungen der Workload-Metriken durchführt. Die Komponente fällt nach einer Woche aus und beeinträchtigt Ihren Workload. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Sie sind nicht über den Zustand des Workloads und die Erreichung von Geschäftsergebnissen informiert. 
+  Zustandstrends zum Workload können im Laufe der Zeit entwickelt werden. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** hoch 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Erfassen Sie Workload-Metriken an einer zentralen Stelle. Analysieren Sie mithilfe von Dashboards und Analytik-Tools die Metriken des Workloads, um Erkenntnisse über den Zustand des Workloads zu gewinnen, Zustandstrends zum Workload zu entwickeln und das Erreichen der Geschäftsergebnisse zu validieren. Implementieren Sie einen Mechanismus zur regelmäßigen Überprüfung von Workload-Metriken. 

 **Kundenbeispiel** 

 AnyCompany Retail führt jede Woche am Mittwoch eine Überprüfung der Workload-Metriken durch. Sie treffen sich mit Stakeholdern aus dem gesamten Unternehmen und gehen die Metriken der vergangenen Woche durch. Während des Meetings kennzeichnen sie die Trends und Erkenntnisse, die sie mit Hilfe der Analytik-Tools gewonnen haben. Es werden interne Dashboards mit den wichtigsten Metriken zum Workload veröffentlicht, die jeder Mitarbeiter einsehen und durchsuchen kann. 

 **Implementierungsschritte** 

1.  Ermitteln Sie die Metriken zum Workload, die mit dem Zustand des Workloads zusammenhängen. Starten Sie mit geschäftlichen KPIs und ermitteln Sie die Metriken für Anwendungen, Komponenten und Plattformen, die einen Gesamtüberblick über den Zustand des Workloads geben. 

   1.  Sie können individuelle Metriken in [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) veröffentlichen. Sie können den [Amazon CloudWatch-Agent](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) nutzen, um Metriken und Protokolle von Amazon EC2-Instances und On-Premises-Servern zu erfassen. 

   1.  Die [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) kann Metriken aus bestehenden Anwendungen erfassen und zum Hinzufügen neuer Metriken verwendet werden. 

   1.  Kunden mit Enterprise Support können den [Building a Monitoring Strategy Workshop](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) (Aufbau einer Überwachungsstrategie) bei ihrem Technical Account Manager anfordern. Dieser Workshop hilft Ihnen beim Aufbau einer Überwachungsstrategie für Ihren Workload. 

1.  Erfassen Sie Workload-Metriken auf einer zentralen Plattform. Wenn die Workload-Metriken auf verschiedenen Plattformen verteilt sind, kann dies die Analyse und Entwicklung von Trends erschweren. Die Plattform sollte über Dashboards und Analytik-Funktionen verfügen. 

   1.  [Amazon CloudWatch](https://docs.aws.amazon.com/) kann Workload-Metriken erfassen und speichern. In Topologien mit mehreren Konten wird ein [zentrales Konto für die Protokollierung und Überwachung](https://docs.aws.amazon.com/prescriptive-guidance/latest/security-reference-architecture/log-archive.html) empfohlen, das als *Konto für das Protokollarchiv* bezeichnet wird. 

1.  Erstellen Sie ein konsolidiertes Dashboard der Workload-Metriken. Verwenden Sie diese Übersicht für die Metriküberprüfung und die Analyse von Trends. 

   1.  Sie können individuelle [CloudWatch Dashboards](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) erstellen, um Ihre Workload-Metriken in einer konsolidierten Übersicht zusammenzufassen. 

1.  Implementieren Sie einen Prozess zur Überprüfung der Workload-Metriken. Überprüfen Sie Ihre Workload Metriken wöchentlich, zweiwöchentlich oder monatlich mit Stakeholdern, einschließlich technischem und nicht-technischem Personal. Nutzen Sie diese Überprüfungen, um Trends zu erkennen und Erkenntnisse über den Zustand des Workloads zu gewinnen. 

 **Grad des Aufwands für den Implementierungsplan:** hoch Wenn Workload-Metriken nicht zentral erfasst werden, könnte die Konsolidierung dieser Metriken auf einer Plattform erhebliche Investitionen verursachen. 

## Ressourcen
<a name="resources"></a>

 **Zugehörige bewährte Methoden:** 
+  [OPS08-BP01 Ermitteln wichtiger Leistungskennzahlen](ops_workload_health_define_workload_kpis.md) - Bevor Sie Workload-Metriken auswählen, müssen Sie zunächst die wichtigsten Leistungsindikatoren ermitteln. 
+  [OPS08-BP02 Definieren von Workload-Metriken](ops_workload_health_design_workload_metrics.md) - Sie müssen Workload-Metriken definieren, bevor Sie diese erfassen und analysieren können. 

 **Zugehörige Dokumente:** 
+ [ Power operational insights with Amazon Quick ](https://aws.amazon.com/blogs/big-data/power-operational-insights-with-amazon-quicksight/) (Mit Amazon QuickSight operative Erkenntnisse nutzen)
+ [ Using Amazon CloudWatch dashboards custom widgets ](https://aws.amazon.com/blogs/mt/introducing-amazon-cloudwatch-dashboards-custom-widgets/) (Amazon CloudWatch-Dashboards mit angepassten Elementen nutzen)

 **Zugehörige Videos:** 
+ [ Create Cross Account & Cross Region CloudWatch Dashboards ](https://www.youtube.com/watch?v=eIUZdaqColg) (Konto- und regionenübergreifende CloudWatch-Dashboards erstellen)
+ [ Monitor AWS Resources Using Amazon CloudWatch Dashboards ](https://www.youtube.com/watch?v=I7EFLChc07M) (AWS-Ressourcen mit CloudWatch-Dashboards überwachen)

 **Zugehörige Beispiele:** 
+ [AWS Management and Governance Tools Workshop – CloudWatch Dashboards ](https://mng.workshop.aws/operations-2022/detect/cwdashboard.html) (Workshop: AWS-Verwaltungs- und -Governance-Tools – CloudWatch-Dashboards)
+ [ Well-Architected Labs – Level 100: Monitoring with CloudWatch Dashboards ](https://www.wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/) (Well-Architected Labs – Level 100: Überwachung mit CloudWatch-Dashboards)

 **Zugehörige Services:** 
+  [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+ [AWS Distro for OpenTelemetry](https://aws-otel.github.io/)

# OPS08-BP04 Festlegen von Ausgangswerten für Workload-Metriken
<a name="ops_workload_health_workload_metric_baselines"></a>

Das Festlegen einer Baseline für Workload-Metriken hilft Ihnen, den Zustand und die Leistung des Workloads nachzuvollziehen. Mithilfe von Baselines können Sie Anwendungen und Komponenten identifizieren, die eine zu geringe oder zu hohe Leistung aufweisen. Eine Workload-Baseline trägt dazu bei, dass Sie Vorfälle entschärfen können, bevor sie zu Problemen werden. Baselines sind bei der Entwicklung von Aktivitätsmustern und der Erkennung von Anomalien bei Abweichungen der Metriken von den erwarteten Werten von grundlegender Bedeutung. 

 **Gewünschtes Ergebnis:** 
+  Sie verfügen über ein Basisniveau von Metriken für Ihren Workload unter normalen Bedingungen. 
+  Sie können feststellen, ob Ihr Workload normal funktioniert. 

 **Typische Anti-Muster:** 
+  Nach der Bereitstellung einer neuen Funktion sinkt die Latenz der Anfragen. Für eine kombinierte Metrik aus eingehenden verarbeiteten Anfragen und der allgemeinen Latenz wurde keine Baseline festgelegt. Sie können nicht feststellen, ob die Änderung eine Verbesserung oder einen Defekt verursacht hat. 
+  Ein plötzlicher Anstieg in der Benutzeraktivität tritt auf. Sie haben jedoch keine Baseline für die Metrik festgelegt. Die Aktivitätsspitze führt langsam zu einem Arbeitsspeicherleck in einer Anwendung. Dies führt schließlich dazu, dass Ihr Workload offline geht. 

 **Vorteile der Nutzung dieser bewährten Methode:** 
+  Sie überblicken das normale Aktivitätsmuster Ihres Workloads anhand von Metriken für Schlüsselkomponenten und Anwendungen. 
+  Sie können feststellen, ob sich Ihr Workload, seine Anwendungen und Komponenten normal verhalten oder ob ein Eingreifen erforderlich ist. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Nutzen Sie historische Daten, um eine Baseline von Workload-Metriken für Anwendungen und Komponenten in Ihrem Workload zu erstellen. Nutzen Sie die Metrik-Baseline in Meetings zur Überprüfung der Metrik und zur Fehlerbehebung. Überprüfen Sie regelmäßig die Leistung des Workloads und passen Sie die Baseline an, wenn sich die Architektur weiterentwickelt. 

 **Kundenbeispiel** 

 Bei AnyCompany Retail werden Baselines für alle Komponenten und Anwendungen erstellt. Anhand historischer Daten hat AnyCompany Retail Workload-Metrik-Baselines über ein zweimonatiges Metrik-Fenster entwickelt. Alle zwei Monate werden die Baselines neu bewertet und auf der Grundlage realer Daten angepasst. 

 **Implementierungsschritte** 

1.  Erstellen Sie ausgehend von Ihren Workload-Metriken anhand historischer Daten eine Metrik-Baseline für Schlüsselkomponenten und Anwendungen. Begrenzen Sie die Anzahl der Metriken pro Komponente oder Anwendung und vermeiden Sie eine übermäßige Überwachung. 

   1.  Sie können [Amazon CloudWatch Metrics Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html) verwenden, um Metriken skaliert abzufragen und Trends und Muster zu erkennen. 

   1.  [Die Amazon CloudWatch-Anomalieerkennung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) verwendet Machine-Learning-Algorithmen, um Verhaltensmuster für Metriken zu identifizieren, Baselines zu bestimmen und Anomalien zu erkennen. 

   1.  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) bietet die Möglichkeit, operative Probleme mit Ihrem Workload mithilfe von Machine Learning zu erkennen. 

   1.  Kunden mit Enterprise Support können den [Building a Monitoring Strategy Workshop](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) (Aufbau einer Überwachungsstrategie) bei ihrem Technical Account Manager anfordern. Dieser Workshop hilft Ihnen bei der Entwicklung einer Überwachungsstrategie für Ihren Workload. 

1.  Richten Sie einen Mechanismus ein, um die Baselines der Workload-Metriken regelmäßig zu überprüfen – insbesondere vor wichtigen Geschäftsereignissen. Bewerten Sie mindestens einmal im Quartal Ihre Workload-Metriken anhand historischer Daten. Verwenden Sie die Baseline in Ihren Meetings zur Überprüfung der Metrik. 

 **Grad des Aufwands für den Implementierungsplan:** niedrig Nach der Festlegung von Workload-Metriken kann es erforderlich sein, dass Sie genügend Daten sammeln, um normale Verhaltensmuster zu erkennen. 

## Ressourcen
<a name="resources"></a>

 **Zugehörige bewährte Methoden:** 
+  [OPS08-BP02 Definieren von Workload-Metriken](ops_workload_health_design_workload_metrics.md) - Bevor Sie Baselines bestimmen können, müssen Sie Workload-Metriken festlegen. 
+  [OPS08-BP03 Erfassen und Analysieren von Workload-Metriken](ops_workload_health_collect_analyze_workload_metrics.md) - Bevor Sie Metrik-Baselines festlegen, müssen Sie Workload-Metriken erfassen und analysieren. 
+  [OPS08-BP05 Lernen erwarteter Aktivitätsmuster für den Workload](ops_workload_health_learn_workload_usage_patterns.md) - Diese bewährte Methode baut auf der Baseline auf, um Nutzungstrends zu entwickeln. 
+  [OPS08-BP06 Alarm bei gefährdeten Workload-Ergebnissen](ops_workload_health_workload_outcome_alerts.md) - Metrik-Baselines sind für die Ermittlung von Schwellenwerten und die Entwicklung von Warnmeldungen erforderlich. 
+  [OPS08-BP07 Alarm bei festgestellten Workload-Anomalien](ops_workload_health_workload_anomaly_alerts.md) - Die Erkennung von Anomalien erfordert die Erstellung von Metrik-Baselines. 

 **Zugehörige Dokumente:** 
+ [AWS Observability Best Practices – Alarms ](https://aws-observability.github.io/observability-best-practices/tools/alarms/) (Bewährte Methoden zur Beobachtung für AWS – Warnungen)
+ [Effektives Überwachen Ihrer Anwendungen](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/)
+ [ How to set up CloudWatch Anomaly Detection to set dynamic alarms, automate actions, and drive online sales ](https://aws.amazon.com/blogs/mt/how-to-set-up-cloudwatch-anomaly-detection-to-set-dynamic-alarms-automate-actions-and-drive-online-sales/) (So richten Sie die CloudWatch-Anomalieerkennung ein, um dynamische Warnungen festzulegen, Aktionen zu automatisieren und den Onlineverkauf zu fördern)
+ [ Operationalizing CloudWatch Anomaly Detection ](https://aws.amazon.com/blogs/mt/operationalizing-cloudwatch-anomaly-detection/) (Operationalisierung der CloudWatch-Anomalieerkennung)

 **Zugehörige Videos:** 
+ [AWS re:Invent 2020: Monitoring production services at Amazon ](https://www.youtube.com/watch?v=hnPcf_Czbvw) (AWS re:Invent 2020: Überwachung von Produktionsservices bei Amazon)
+ [AWS re:Invent 2021 – Get insights from operational metrics at scale with CloudWatch Metrics Insights ](https://www.youtube.com/watch?v=xKib0xvbIfo) (AWS re:Invent 2021 – Gewinnen Sie mit CloudWatch Metrics Insights skalierte Erkenntnisse aus operativen Metriken)
+ [AWS re:Invent 2022 – Developing an observability strategy (COP302) ](https://www.youtube.com/watch?v=Ub3ATriFapQ) (AWS re:Invent 2022 – Entwicklung einer Strategie zur Beobachtbarkeit (COP302))
+ [AWS Summit DC 2022 – Monitoring and observability for modern applications](https://www.youtube.com/watch?v=AHiuyT0B5Gk) (AWS Summit DC 2022 – Überwachung und Beobachtbarkeit für moderne Anwendungen)
+ [AWS Summit SF 2022 – Full-stack observability and application monitoring with AWS (COP310) ](https://www.youtube.com/watch?v=or7uFFyHIX0) (AWS Summit SF 2022 – Full-Stack-Beobachtbarkeit und -Überwachung von Anwendungen mit AWS (COP310))

 **Zugehörige Beispiele:** 
+ [AWS CloudTrail and Amazon CloudWatch Integration Workshop ](https://catalog.us-east-1.prod.workshops.aws/workshops/2e48b9fc-f721-4417-b811-962b7f31b61c/en-US) (AWS CloudTrail und AWS CloudWatch Integrations-Workshop)

 **Zugehörige Services:** 
+ [ Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [ Amazon DevOps Guru ](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html)

# OPS08-BP05 Lernen erwarteter Aktivitätsmuster für den Workload
<a name="ops_workload_health_learn_workload_usage_patterns"></a>

 Zeichnen Sie Workload-Aktivitätsmuster auf, um außergewöhnliches Verhalten zu identifizieren, damit Sie bei Bedarf entsprechend reagieren können. 

 CloudWatch durch die [Funktion CloudWatch Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) wendet statistische und Machine Learning-Algorithmen an, um eine Reihe von erwarteten Werten zu generieren, die ein normales Metrikverhalten darstellen. 

 [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) kann verwendet werden, um außergewöhnliches Verhalten über die Korrelation von Ereignissen, Protokollanalysen und die Anwendung von Machine Learning zu identifizieren und Ihre Workload-Telemetrie zu analysieren. Wird unerwartetes Verhalten erkannt, erhalten die [zugehörigen Metriken und Ereignisse](https://docs.aws.amazon.com/devops-guru/latest/userguide/understanding-insights-console.html) Empfehlungen, um das Verhalten anzugehen. 

 **Gängige Antimuster:** 
+  Sie prüfen Netzwerkauslastungsprotokolle und stellen fest, dass die Netzwerkauslastung zwischen 11.30 und 13.30 Uhr und dann erneut zwischen 16.30 und 18.00 Uhr gestiegen ist. Sie wissen nicht, ob diese Werte als normal betrachtet werden können. 
+  Ihre Webserver werden jede Nacht um 3.00 Uhr neu gestartet. Sie wissen nicht, ob dies erwartetes Verhalten ist. 

 **Vorteile der Einführung dieser bewährten Methode:** Durch das Aufzeichnen von Verhaltensmustern können Sie unerwartetes Verhalten erkennen und bei Bedarf Maßnahmen ergreifen. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Mehr über erwartete Aktivitätsmuster für Workload erfahren: Legen Sie Muster für die Workload-Aktivität fest, um festzustellen, wann das Verhalten von den erwarteten Werten abweicht, so dass Sie bei Bedarf angemessen reagieren können. 

## Ressourcen
<a name="resources"></a>

 **Zugehörige Dokumente:** 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [Funktion CloudWatch Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 

# OPS08-BP06 Alarm bei gefährdeten Workload-Ergebnissen
<a name="ops_workload_health_workload_outcome_alerts"></a>

 Lösen Sie einen Alarm aus, wenn die Workload-Ergebnisse gefährdet sind, damit Sie bei Bedarf angemessen reagieren können. 

 Idealerweise haben Sie zuvor einen Metrikschwellenwert identifiziert, bei dem Sie Alarme senden können, oder ein Ereignis, das Sie verwenden können, um eine automatisierte Antwort auszulösen. 

 In AWS können Sie [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) verwenden, um Canary-Skripts zur Überwachung Ihrer Endpunkte und APIs zu erstellen, indem Sie dieselben Aktionen ausführen wie Ihre Kunden. Durch die generierte Telemetrie und die [erhaltenen Einblicke](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_Details.html) können Sie Probleme identifizieren, bevor die Kunden davon betroffen sind. 

 Sie können [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) verwenden, um Ihre Protokolldaten mithilfe einer speziell entwickelten Abfragesprache interaktiv zu durchsuchen und zu analysieren. CloudWatch Logs Insights entdeckt automatisch [Felder in Protokollen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData-discoverable-fields.html) von AWS-Services und benutzerdefinierte Protokollereignisse in JSON. Es skaliert mit Ihrem Protokollvolumen und der Komplexität Ihrer Abfrage und gibt Ihnen innerhalb von Sekunden Antworten, sodass Sie nach den beitragenden Faktoren eines Vorfalls suchen können. 

 **Gängige Antimuster:** 
+  Sie haben keine Netzwerkkonnektivität. Niemand weiß es. Niemand versucht die Ursache zu ermitteln oder ergreift Maßnahmen, um die Konnektivität wiederherzustellen. 
+  Nach einem Patch sind Ihre persistenten Instances nicht mehr verfügbar und sorgen für Unterbrechungen bei den Benutzern. Ihre Benutzer haben Supportanfragen gestellt. Niemand wurde benachrichtigt. Niemand ergreift Maßnahmen. 

 **Vorteile der Einführung dieser bewährten Methode:** Indem Sie feststellen, dass Geschäftsergebnisse gefährdet sind, und mit einem Alarm auf erforderliche Maßnahmen hinweisen, können Sie die Auswirkungen eines Vorfalls verhindern oder mindern. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Alarm bei gefährdeten Workload-Ergebnissen auslösen: Lösen Sie einen Alarm aus, wenn Workload-Ergebnisse gefährdet sind, damit Sie bei Bedarf entsprechend reagieren können. 
  +  [Was ist Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Erstellen von Amazon CloudWatch-Alarmen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Auslösen von Lambda-Funktionen mit Amazon SNS-Benachrichtigungen](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Ressourcen
<a name="resources"></a>

 **Zugehörige Dokumente:** 
+  [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 
+  [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) 
+  [Erstellen von Amazon CloudWatch-Alarmen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Auslösen von Lambda-Funktionen mit Amazon SNS-Benachrichtigungen](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Was ist Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP07 Alarm bei festgestellten Workload-Anomalien
<a name="ops_workload_health_workload_anomaly_alerts"></a>

 Lösen Sie einen Alarm aus, wenn Workload-Anomalien festgestellt werden, damit Sie bei Bedarf angemessen reagieren können. 

 Ihre Analyse Ihrer Workload-Metriken im Laufe der Zeit kann Verhaltensmuster bestimmen, die Sie ausreichend quantifizieren können, um ein Ereignis zu definieren oder als Reaktion einen Alarm auszulösen. 

 Nach der Schulung kann die Funktion [Funktion CloudWatch Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) verwendet werden, um [bei](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) erkannten Anomalien einen Alarm auszulösen oder überlagerte erwartete Werte in einem [Diagramm](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_a_metric.html#create-metric-graph) mit Metrikdaten für einen laufenden Vergleich bereitzustellen. 

 **Gängige Antimuster:** 
+  Der Umsatz über Ihre Einzelhandelswebsite ist plötzlich und drastisch angestiegen. Niemand weiß es. Niemand versucht herauszufinden, was zu diesem Anstieg geführt hat. Niemand ergreift Maßnahmen, um angesichts der zusätzlichen Last ein hochwertiges Kundenerlebnis sicherzustellen. 
+  Nach der Anwendung eines Patches führen Ihre persistenten Server häufige Neustarts durch, was zu Unterbrechungen für die Benutzer führt. Ihre Server werden in der Regel bis zu drei Mal neu gestartet. Niemand weiß es. Niemand versucht, der Sache auf den Grund zu gehen. 

 **Vorteile der Einführung dieser bewährten Methode:** Wenn Sie mit Workload-Verhaltensmustern vertraut sind, können Sie unerwartetes Verhalten identifizieren und bei Bedarf Maßnahmen ergreifen. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Niedrig 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Alarm bei festgestellten Workload-Anomalien auslösen: Lösen Sie einen Alarm aus, wenn Workload-Anomalien erkannt werden, damit Sie bei Bedarf entsprechend reagieren können. 
  +  [Was ist Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Erstellen von Amazon CloudWatch-Alarmen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Auslösen von Lambda-Funktionen mit Amazon SNS-Benachrichtigungen](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Ressourcen
<a name="resources"></a>

 **Zugehörige Dokumente:** 
+  [Erstellen von Amazon CloudWatch-Alarmen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Funktion CloudWatch Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 
+  [Auslösen von Lambda-Funktionen mit Amazon SNS-Benachrichtigungen](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Was ist Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP08 Prüfen der Erreichung von angestrebten Ergebnissen und der Wirksamkeit von KPIs und Metriken
<a name="ops_workload_health_biz_level_view_workload"></a>

 Erstellen Sie eine Ansicht Ihrer Workload-Operationen auf Geschäftsebene, mit der Sie schnell feststellen können, ob Sie die Anforderungen erfüllen, und welche Bereiche verbessert werden müssen, um die Geschäftsziele zu erreichen. Prüfen Sie die Wirksamkeit von KPIs und Metriken und überarbeiten Sie diese gegebenenfalls. 

 AWS bietet über die AWS-Service-APIs und -SDKs auch Support für Protokollanalysesysteme und Business Intelligence-Tools von Drittanbietern (z. B. Grafana, Kibana und Logstash). 

 **Gängige Antimuster:** 
+  Die Seitenreaktionszeit wurde noch nie mit der Kundenzufriedenheit in Verbindung gebracht. Sie haben noch nie eine Metrik oder einen Schwellenwert für die Seitenreaktionszeit festgelegt. Ihre Kunden beschweren sich über langsame Ladevorgänge. 
+  Sie haben Ihre Zielwerte für die minimale Reaktionszeit nicht erreicht. Um die Reaktionszeit zu verbessern, haben Sie Ihre Anwendungsserver skaliert. Sie erzielen jetzt Reaktionszeiten, die weit über die Zielwerte hinausgehen, und haben erhebliche ungenutzte Kapazitäten, für die Sie zahlen. 

 **Vorteile der Einführung dieser bewährten Praxis:** Wenn Sie KPIs und Metriken überprüfen und überarbeiten, können Sie nachvollziehen, wie sich Ihr Workload auf die Geschäftsergebnisse auswirkt, und ermitteln, wo Verbesserungen erforderlich sind, um die Geschäftsziele zu erreichen. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Niedrig 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>
+  Erfolg von Ergebnissen und die Effektivität von KPIs und Metriken prüfen: Erstellen Sie eine Geschäftsansicht Ihrer Workload-Vorgänge, um festzustellen, ob Sie die Anforderungen erfüllen, und um Bereiche zu identifizieren, die verbessert werden müssen, um Geschäftsziele zu erreichen. Prüfen Sie die Wirksamkeit von KPIs und Metriken und überarbeiten Sie diese gegebenenfalls. 
  +  [Verwendung von Amazon CloudWatch-Dashboards](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
  +  [Was ist Protokollanalytik?](https://aws.amazon.com/log-analytics/) 

## Ressourcen
<a name="resources"></a>

 **Verbundene Dokumente:** 
+  [Verwendung von Amazon CloudWatch-Dashboards](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
+  [Was ist Protokollanalytik?](https://aws.amazon.com/log-analytics/)