OPS08-BP04 Festlegen von Ausgangswerten für Workload-Metriken
Das Festlegen einer Baseline für Workload-Metriken hilft Ihnen, den Zustand und die Leistung des Workloads nachzuvollziehen. Mithilfe von Baselines können Sie Anwendungen und Komponenten identifizieren, die eine zu geringe oder zu hohe Leistung aufweisen. Eine Workload-Baseline trägt dazu bei, dass Sie Vorfälle entschärfen können, bevor sie zu Problemen werden. Baselines sind bei der Entwicklung von Aktivitätsmustern und der Erkennung von Anomalien bei Abweichungen der Metriken von den erwarteten Werten von grundlegender Bedeutung.
Gewünschtes Ergebnis:
-
Sie verfügen über ein Basisniveau von Metriken für Ihren Workload unter normalen Bedingungen.
-
Sie können feststellen, ob Ihr Workload normal funktioniert.
Typische Anti-Muster:
-
Nach der Bereitstellung einer neuen Funktion sinkt die Latenz der Anfragen. Für eine kombinierte Metrik aus eingehenden verarbeiteten Anfragen und der allgemeinen Latenz wurde keine Baseline festgelegt. Sie können nicht feststellen, ob die Änderung eine Verbesserung oder einen Defekt verursacht hat.
-
Ein plötzlicher Anstieg in der Benutzeraktivität tritt auf. Sie haben jedoch keine Baseline für die Metrik festgelegt. Die Aktivitätsspitze führt langsam zu einem Arbeitsspeicherleck in einer Anwendung. Dies führt schließlich dazu, dass Ihr Workload offline geht.
Vorteile der Nutzung dieser bewährten Methode:
-
Sie überblicken das normale Aktivitätsmuster Ihres Workloads anhand von Metriken für Schlüsselkomponenten und Anwendungen.
-
Sie können feststellen, ob sich Ihr Workload, seine Anwendungen und Komponenten normal verhalten oder ob ein Eingreifen erforderlich ist.
Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: mittel
Implementierungsleitfaden
Nutzen Sie historische Daten, um eine Baseline von Workload-Metriken für Anwendungen und Komponenten in Ihrem Workload zu erstellen. Nutzen Sie die Metrik-Baseline in Meetings zur Überprüfung der Metrik und zur Fehlerbehebung. Überprüfen Sie regelmäßig die Leistung des Workloads und passen Sie die Baseline an, wenn sich die Architektur weiterentwickelt.
Kundenbeispiel
Bei AnyCompany Retail werden Baselines für alle Komponenten und Anwendungen erstellt. Anhand historischer Daten hat AnyCompany Retail Workload-Metrik-Baselines über ein zweimonatiges Metrik-Fenster entwickelt. Alle zwei Monate werden die Baselines neu bewertet und auf der Grundlage realer Daten angepasst.
Implementierungsschritte
-
Erstellen Sie ausgehend von Ihren Workload-Metriken anhand historischer Daten eine Metrik-Baseline für Schlüsselkomponenten und Anwendungen. Begrenzen Sie die Anzahl der Metriken pro Komponente oder Anwendung und vermeiden Sie eine übermäßige Überwachung.
-
Sie können Amazon CloudWatch Metrics Insights verwenden, um Metriken skaliert abzufragen und Trends und Muster zu erkennen.
-
Die Amazon CloudWatch-Anomalieerkennung verwendet Machine-Learning-Algorithmen, um Verhaltensmuster für Metriken zu identifizieren, Baselines zu bestimmen und Anomalien zu erkennen.
-
Amazon DevOps Guru bietet die Möglichkeit, operative Probleme mit Ihrem Workload mithilfe von Machine Learning zu erkennen.
-
Kunden mit Enterprise Support können den Building a Monitoring Strategy Workshop
(Aufbau einer Überwachungsstrategie) bei ihrem Technical Account Manager anfordern. Dieser Workshop hilft Ihnen bei der Entwicklung einer Überwachungsstrategie für Ihren Workload.
-
-
Richten Sie einen Mechanismus ein, um die Baselines der Workload-Metriken regelmäßig zu überprüfen – insbesondere vor wichtigen Geschäftsereignissen. Bewerten Sie mindestens einmal im Quartal Ihre Workload-Metriken anhand historischer Daten. Verwenden Sie die Baseline in Ihren Meetings zur Überprüfung der Metrik.
Grad des Aufwands für den Implementierungsplan: niedrig Nach der Festlegung von Workload-Metriken kann es erforderlich sein, dass Sie genügend Daten sammeln, um normale Verhaltensmuster zu erkennen.
Ressourcen
Zugehörige bewährte Methoden:
-
OPS08-BP02 Definieren von Workload-Metriken - Bevor Sie Baselines bestimmen können, müssen Sie Workload-Metriken festlegen.
-
OPS08-BP03 Erfassen und Analysieren von Workload-Metriken - Bevor Sie Metrik-Baselines festlegen, müssen Sie Workload-Metriken erfassen und analysieren.
-
OPS08-BP05 Lernen erwarteter Aktivitätsmuster für den Workload - Diese bewährte Methode baut auf der Baseline auf, um Nutzungstrends zu entwickeln.
-
OPS08-BP06 Alarm bei gefährdeten Workload-Ergebnissen - Metrik-Baselines sind für die Ermittlung von Schwellenwerten und die Entwicklung von Warnmeldungen erforderlich.
-
OPS08-BP07 Alarm bei festgestellten Workload-Anomalien - Die Erkennung von Anomalien erfordert die Erstellung von Metrik-Baselines.
Zugehörige Dokumente:
-
AWS Observability Best Practices – Alarms
(Bewährte Methoden zur Beobachtung für AWS – Warnungen) -
How to set up CloudWatch Anomaly Detection to set dynamic alarms, automate actions, and drive online sales
(So richten Sie die CloudWatch-Anomalieerkennung ein, um dynamische Warnungen festzulegen, Aktionen zu automatisieren und den Onlineverkauf zu fördern) -
Operationalizing CloudWatch Anomaly Detection
(Operationalisierung der CloudWatch-Anomalieerkennung)
Zugehörige Videos:
-
AWS re:Invent 2020: Monitoring production services at Amazon
(AWS re:Invent 2020: Überwachung von Produktionsservices bei Amazon) -
AWS re:Invent 2021 – Get insights from operational metrics at scale with CloudWatch Metrics Insights
(AWS re:Invent 2021 – Gewinnen Sie mit CloudWatch Metrics Insights skalierte Erkenntnisse aus operativen Metriken) -
AWS re:Invent 2022 – Developing an observability strategy (COP302)
(AWS re:Invent 2022 – Entwicklung einer Strategie zur Beobachtbarkeit (COP302)) -
AWS Summit DC 2022 – Monitoring and observability for modern applications
(AWS Summit DC 2022 – Überwachung und Beobachtbarkeit für moderne Anwendungen) -
AWS Summit SF 2022 – Full-stack observability and application monitoring with AWS (COP310)
(AWS Summit SF 2022 – Full-Stack-Beobachtbarkeit und -Überwachung von Anwendungen mit AWS (COP310))
Zugehörige Beispiele:
-
AWS CloudTrail and Amazon CloudWatch Integration Workshop
(AWS CloudTrail und AWS CloudWatch Integrations-Workshop)
Zugehörige Services: