Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Stufe 3: Inspizieren, anpassen und iterieren
Nach der Implementierung Ihres Observability-Systems empfehlen wir Ihnen, Ihre Implementierung kontinuierlich zu überprüfen, zu bewerten, zu erlernen, anzupassen und zu verbessern. Sie können das AWS Observability Maturity Model
Führen Sie regelmäßige Überprüfungen durch
Beobachtbarkeit ist ein iterativer Prozess. Es erfordert regelmäßige Audits und Bewertungen vorhandener Komponenten sowie Änderungen und Verbesserungen, um eine kontinuierliche Verbesserung voranzutreiben. Wir empfehlen Ihnen, regelmäßige Überprüfungen durchzuführen, um Schwellenwerte für Warnmeldungen SLOs, Dashboards, Metrikgranularität, Aufbewahrungsrichtlinien, Stichprobenstrategien usw. neu zu bewerten, um sicherzustellen, dass diese den Mehrwert für Ihre Teams und Ihr Unternehmen steigern. Indem Sie die Kosten für die Beobachtbarkeit mit bestimmten Teams und Services verknüpfen, können Sie datengestützte Entscheidungen über den Umfang und die Ressourcenzuweisung treffen.
Bei Amazon führen wir wöchentliche Operational Readiness Readiness Readiness Reviews (ORRs) durch, um die Prozesse und den Zustand der Beobachtbarkeit der Teams anhand bewährter Verfahren zu überprüfen. Dabei handelt es sich um eine nicht blockierende Maßnahme, die der Anzahl der Services und der Häufigkeit der Veröffentlichungen bei Amazon entspricht.
Je nach Größe Ihres Unternehmens können Sie auch einen Dienstplan wie gewohnt (BAU) einrichten, bei dem ein Mitglied jedes Teams dafür verantwortlich ist, über Anomalien und Trends zu berichten, unbekannte Unbekannte aufzudecken, unerwünschte Instrumente und Benachrichtigungen zu entfernen, Dashboards zu verbessern und sicherzustellen, dass die Observability-Lösung weiterhin für das Team funktioniert und auf die Ziele und Erfolgskennzahlen des Teams abgestimmt ist. Dies könnte auch eine Gelegenheit sein, die Warnstrategie zu überdenken, um schneller, proaktiver und näher am Benutzer zu sein. Ziel dieser Überprüfungen ist es, einen positiven Kreislauf zu schaffen, wie in der folgenden Abbildung dargestellt, und den Reifegrad Ihrer Observability-Haltung zu verbessern, wie im Observability Maturity Model beschrieben.AWS
Identifizieren Sie die Playbooks, auf die am häufigsten zugegriffen wird, und erwägen Sie, Ihre Anwendung zu verbessern oder weitere Instrumente hinzuzufügen. Identifizieren Sie die Runbooks, die am häufigsten ausgeführt werden, und erwägen Sie, diese Runbooks zu automatisieren.
Die Erkenntnisse aus diesen Überprüfungen werden auch dem Observability-Team und den Experten zur Verfügung gestellt, um Verbesserungen der zentralen Programme und der Observability-Plattform aufzuzeigen. Abhängig von der Häufigkeit der durch die Bereitstellung ausgelösten Ereignisse könnten Sie sich beispielsweise dafür entscheiden, der Verbesserung der Bereitstellungspipeline Vorrang vor anderen Komponenten einzuräumen. Wenn die MTTR aufgrund von Überwachungslücken höher ist, können Sie der Verbesserung der Observability-Plattform und ihrer Konfiguration Priorität einräumen.
Feiern Sie Siege
Erzählen Sie Erfolgsgeschichten von Teams, die Observability-Tools verwenden. Heben Sie beispielsweise den Erfolg eines Teams hervor, das anhand von Beobachtungskennzahlen eine alternative Lösung implementiert hat, die effizienter ist und zu einer geringeren Latenz oder geringeren Kosten führt. Die Kommunikation dieses Erfolgs unterstreicht die Bedeutung der Beobachtbarkeit und motiviert andere Teams, ihre Haltung zur Beobachtbarkeit zu verbessern und ähnliche Erfolge anzustreben.
Lernen Sie aus Vorfällen
Führen Sie nach einem Vorfall untadelige Übungen durch, die dem Prozess zur Fehlerkorrektur (COE)