Führen Sie regelmäßige Überprüfungen durch Feiern Sie Siege Lernen Sie aus Vorfällen

Stufe 3: Inspizieren, anpassen und iterieren

Nach der Implementierung Ihres Observability-Systems empfehlen wir Ihnen, Ihre Implementierung kontinuierlich zu überprüfen, zu bewerten, zu erlernen, anzupassen und zu verbessern. Sie können das AWS Observability Maturity Model als Tool verwenden, um den Reifegrad Ihrer Implementierung zu bewerten und Bereiche mit Verbesserungspotenzial zu identifizieren und zu priorisieren.

Führen Sie regelmäßige Überprüfungen durch

Beobachtbarkeit ist ein iterativer Prozess. Es erfordert regelmäßige Audits und Bewertungen vorhandener Komponenten sowie Änderungen und Verbesserungen, um eine kontinuierliche Verbesserung voranzutreiben. Wir empfehlen Ihnen, regelmäßige Überprüfungen durchzuführen, um SLOs, Alarmschwellenwerte, Dashboards, Metrikgranularität, Aufbewahrungsrichtlinien, Stichprobenstrategien usw. neu zu bewerten, um sicherzustellen, dass diese einen Mehrwert für Ihre Teams und Ihr Unternehmen bieten. Indem Sie die Observability-Kosten mit bestimmten Teams und Services verknüpfen, können Sie datengestützte Entscheidungen über den Versicherungsschutz und die Ressourcenzuweisung treffen.

Bei Amazon führen wir wöchentliche Operational Readiness Readiness Reviews (ORRs) durch, um die Prozesse und den Zustand der Beobachtbarkeit der Teams anhand bewährter Verfahren zu überprüfen. Dabei handelt es sich um eine nicht blockierende Maßnahme, die der Anzahl der Services und der Häufigkeit der Veröffentlichungen bei Amazon entspricht.

Je nach Größe Ihres Unternehmens können Sie auch einen Dienstplan wie gewohnt (BAU) einrichten, bei dem ein Mitglied jedes Teams dafür verantwortlich ist, über Anomalien und Trends zu berichten, unbekannte Unbekannte aufzudecken, unerwünschte Instrumente und Benachrichtigungen zu entfernen, Dashboards zu verbessern und sicherzustellen, dass die Observability-Lösung weiterhin für das Team funktioniert und auf die Ziele und Erfolgskennzahlen des Teams abgestimmt ist. Dies könnte auch eine Gelegenheit sein, die Warnstrategie zu überdenken, um schneller, proaktiver und näher am Benutzer zu sein. Ziel dieser Überprüfungen ist es, einen positiven Kreislauf zu schaffen, wie in der folgenden Abbildung dargestellt, und den Reifegrad Ihrer Observability-Haltung zu verbessern, wie im Observability Maturity Model beschrieben.AWS

Feedback- und Überprüfungszyklus im Rahmen des iterativen Beobachtbarkeitsprozesses.

Identifizieren Sie die Playbooks, auf die am häufigsten zugegriffen wird, und ziehen Sie in Betracht, Ihre Anwendung zu verbessern oder weitere Instrumente hinzuzufügen. Identifizieren Sie die Runbooks, die am häufigsten ausgeführt werden, und erwägen Sie, diese Runbooks zu automatisieren.

Die Erkenntnisse aus diesen Überprüfungen werden auch dem Observability-Team und den Experten zur Verfügung gestellt, um Verbesserungen der zentralen Programme und der Observability-Plattform aufzuzeigen. Abhängig von der Häufigkeit der durch die Bereitstellung ausgelösten Ereignisse könnten Sie sich beispielsweise dafür entscheiden, der Verbesserung der Bereitstellungspipeline Vorrang vor anderen Komponenten einzuräumen. Wenn die MTTR aufgrund von Überwachungslücken höher ist, können Sie der Verbesserung der Observability-Plattform und ihrer Konfiguration Priorität einräumen.

Feiern Sie Siege

Erzählen Sie Erfolgsgeschichten von Teams, die Observability-Tools verwenden. Heben Sie beispielsweise den Erfolg eines Teams hervor, das anhand von Beobachtungskennzahlen eine alternative Lösung implementiert hat, die effizienter ist und zu einer geringeren Latenz oder geringeren Kosten führt. Die Kommunikation dieses Erfolgs unterstreicht die Bedeutung der Beobachtbarkeit und motiviert andere Teams, ihre Haltung zur Beobachtbarkeit zu verbessern und ähnliche Erfolge anzustreben.

Lernen Sie aus Vorfällen

Führen Sie nach einem Vorfall untadelige Übungen durch, die dem Prozess zur Fehlerkorrektur (COE) bei Amazon ähneln, um Bereiche mit Verbesserungspotenzial zu identifizieren und future Probleme zu vermeiden. Wie bei Siegen können die Erkenntnisse aus dieser Übung umfassend mit anderen Teams geteilt werden, um den Wert von Beobachtbarkeit und bewährten Verfahren zu stärken.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Stufe 2: Beobachtbarkeit implementieren

Nächste Schritte und Ressourcen