View a markdown version of this page

OPS08-BP04 Festlegen von Ausgangswerten für Workload-Metriken - AWS Well-Architected Framework

OPS08-BP04 Festlegen von Ausgangswerten für Workload-Metriken

Das Festlegen einer Baseline für Workload-Metriken hilft Ihnen, den Zustand und die Leistung des Workloads nachzuvollziehen. Mithilfe von Baselines können Sie Anwendungen und Komponenten identifizieren, die eine zu geringe oder zu hohe Leistung aufweisen. Eine Workload-Baseline trägt dazu bei, dass Sie Vorfälle entschärfen können, bevor sie zu Problemen werden. Baselines sind bei der Entwicklung von Aktivitätsmustern und der Erkennung von Anomalien bei Abweichungen der Metriken von den erwarteten Werten von grundlegender Bedeutung.

Gewünschtes Ergebnis:

  • Sie verfügen über ein Basisniveau von Metriken für Ihren Workload unter normalen Bedingungen.

  • Sie können feststellen, ob Ihr Workload normal funktioniert.

Typische Anti-Muster:

  • Nach der Bereitstellung einer neuen Funktion sinkt die Latenz der Anfragen. Für eine kombinierte Metrik aus eingehenden verarbeiteten Anfragen und der allgemeinen Latenz wurde keine Baseline festgelegt. Sie können nicht feststellen, ob die Änderung eine Verbesserung oder einen Defekt verursacht hat.

  • Ein plötzlicher Anstieg in der Benutzeraktivität tritt auf. Sie haben jedoch keine Baseline für die Metrik festgelegt. Die Aktivitätsspitze führt langsam zu einem Arbeitsspeicherleck in einer Anwendung. Dies führt schließlich dazu, dass Ihr Workload offline geht.

Vorteile der Nutzung dieser bewährten Methode:

  • Sie überblicken das normale Aktivitätsmuster Ihres Workloads anhand von Metriken für Schlüsselkomponenten und Anwendungen.

  • Sie können feststellen, ob sich Ihr Workload, seine Anwendungen und Komponenten normal verhalten oder ob ein Eingreifen erforderlich ist.

Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: mittel

Implementierungsleitfaden

Nutzen Sie historische Daten, um eine Baseline von Workload-Metriken für Anwendungen und Komponenten in Ihrem Workload zu erstellen. Nutzen Sie die Metrik-Baseline in Meetings zur Überprüfung der Metrik und zur Fehlerbehebung. Überprüfen Sie regelmäßig die Leistung des Workloads und passen Sie die Baseline an, wenn sich die Architektur weiterentwickelt.

Kundenbeispiel

Bei AnyCompany Retail werden Baselines für alle Komponenten und Anwendungen erstellt. Anhand historischer Daten hat AnyCompany Retail Workload-Metrik-Baselines über ein zweimonatiges Metrik-Fenster entwickelt. Alle zwei Monate werden die Baselines neu bewertet und auf der Grundlage realer Daten angepasst.

Implementierungsschritte

  1. Erstellen Sie ausgehend von Ihren Workload-Metriken anhand historischer Daten eine Metrik-Baseline für Schlüsselkomponenten und Anwendungen. Begrenzen Sie die Anzahl der Metriken pro Komponente oder Anwendung und vermeiden Sie eine übermäßige Überwachung.

    1. Sie können Amazon CloudWatch Metrics Insights verwenden, um Metriken skaliert abzufragen und Trends und Muster zu erkennen.

    2. Die Amazon CloudWatch-Anomalieerkennung verwendet Machine-Learning-Algorithmen, um Verhaltensmuster für Metriken zu identifizieren, Baselines zu bestimmen und Anomalien zu erkennen.

    3. Amazon DevOps Guru bietet die Möglichkeit, operative Probleme mit Ihrem Workload mithilfe von Machine Learning zu erkennen.

    4. Kunden mit Enterprise Support können den Building a Monitoring Strategy Workshop (Aufbau einer Überwachungsstrategie) bei ihrem Technical Account Manager anfordern. Dieser Workshop hilft Ihnen bei der Entwicklung einer Überwachungsstrategie für Ihren Workload.

  2. Richten Sie einen Mechanismus ein, um die Baselines der Workload-Metriken regelmäßig zu überprüfen – insbesondere vor wichtigen Geschäftsereignissen. Bewerten Sie mindestens einmal im Quartal Ihre Workload-Metriken anhand historischer Daten. Verwenden Sie die Baseline in Ihren Meetings zur Überprüfung der Metrik.

Grad des Aufwands für den Implementierungsplan: niedrig Nach der Festlegung von Workload-Metriken kann es erforderlich sein, dass Sie genügend Daten sammeln, um normale Verhaltensmuster zu erkennen.

Ressourcen

Zugehörige bewährte Methoden:

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele:

Zugehörige Services: