OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie
Entwickeln und konfigurieren Sie Ihren Workload so, dass Sie Informationen zum Status der Ressourcen erhalten, von denen er abhängt. Dies sind Ressourcen, die außerhalb Ihres Workloads liegen. Beispiele für externe Abhängigkeiten können externe Datenbanken, DNS und Netzwerkkonnektivität sein. Verwenden Sie diese Informationen, um festzulegen, wann eine Reaktion erforderlich ist, und geben Sie zusätzlichen Kontext zum Status des Workloads an.
Gewünschtes Ergebnis:
-
Ihr Workload gibt telemetrische Daten zum Status externer Abhängigkeiten aus.
-
Sie werden benachrichtigt, wenn Probleme mit solchen Abhängigkeiten vorliegen.
Typische Anti-Muster:
-
Ihre Benutzer können Ihre Website nicht erreichen. Sie können nicht feststellen, ob der Grund dafür ein DNS-Problem ist, ohne manuell zu überprüfen, ob der Service Ihres DNS-Anbieters funktioniert.
-
Ihre Warenkorb-Anwendung kann keine Transaktionen abschließen. Sie können nicht feststellen, ob dies an einem Problem bei Ihrem Kreditkarten-Verarbeitungsanbieter liegt, ohne bei ihm nachzufragen.
Vorteile der Nutzung dieser bewährten Methode:
-
Die Überwachung externer Abhängigkeiten macht Sie im Voraus auf Probleme aufmerksam.
-
Die Kenntnis des Zustands Ihrer Abhängigkeiten unterstützt die Fehlerbehebung.
Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: mittel
Implementierungsleitfaden
Arbeiten Sie mit den Beteiligten zusammen an der Identifizierung externer Abhängigkeiten Ihres Workloads. Zu diesen können externe Datenbanken, APIs oder die Netzwerkkonnektivität zwischen Ihrem Workload und Ressourcen in anderen Umgebungen gehören. Entwickeln Sie eine Überwachungsstrategie, um über den Zustand von Abhängigkeiten informiert zu sein und proaktiv benachrichtigt zu werden, wenn sich ein Status ändert.
Kundenbeispiel
Der eCommerce-Workload von AnyCompany Retail hängt von einer in einer anderen Umgebung befindlichen Datenbank ab. In jeder Nacht werden Daten in die Datenbank eingelesen, die für die eCommerce-Plattform genutzt werden. Die Verantwortung für die Netzwerkkonnektivität und den Datenbanksupport liegt bei anderen Teams. Das eCommerce-Team hat verschiedene Canary-Alarme konfiguriert, um informiert zu werden, wenn die Netzwerkkonnektivität ausfällt, die Datenbank nicht erreicht werden kann und wenn Aufgaben nicht abgeschlossen werden.
Implementierungsschritte
-
Identifizieren Sie externe Abhängigkeiten Ihres Workloads. Implementieren Sie Telemetrie, um den Zustand und die Erreichbarkeit solcher Abhängigkeiten zu prüfen.
-
AWS-Kunden können mit AWS Health Dashboard den Zustand von AWS-Services überwachen und Benachrichtigungen zu Ereignissen erhalten.
-
Mit Amazon CloudWatch Synthetics können Sie APIs, URLs und Websiteinhalte überwachen.
-
-
Richten Sie Alarme ein, die Ihre Organisation darauf aufmerksam machen, wenn eine Abhängigkeit ein Problem aufweist oder nicht erreicht werden kann.
-
Kunden mit Enterprise Support können bei ihrem Technical Account Manager einen Workshop zum Thema Aufbau einer Überwachungsstrategie
anfragen. Ein solcher Workshop hilft bei der Entwicklung einer Überwachungsstrategie für Ihren Workload.
-
-
Identifizieren Sie Ansprechpartner für Abhängigkeiten, die bei Problemen verfügbar sind. Dokumentieren Sie, wie Sie sich an Verantwortliche für die Abhängigkeiten wenden können, sowie die Servicevereinbarungen und das Eskalierungsverfahren.
Grad des Aufwands für den Implementierungsplan: mittel. Die Implementierung von Telemetrie für Abhängigkeiten kann das Erstellen eigener Überwachungslösungen erfordern.
Ressourcen
Zugehörige bewährte Methoden:
-
OPS04-BP01 Implementieren einer Anwendungstelemetrie – Sie können die Überwachung von Abhängigkeiten in Ihre Anwendungstelemetrie integrieren.
Zugehörige Dokumente:
-
Monitor your private internal endpoints 24x7 using CloudWatch Synthetics
(Ihre privaten internen Endpunkte rund um die Uhr mit CloudWatch Synthetics überwachen)
Zugehörige Videos:
-
AWS re:Invent 2018: Monitor All Your Things: Amazon CloudWatch in Action with BBC
(AWS re:Invent 2018: Alles überwachen: Amazon CloudWatch in Aktion mit BBC) -
AWS re:Invent 2022 - Developing an observability strategy
(Entwicklung einer Überwachungsstrategie) -
AWS re:Invent 2022 - Observability best practices at Amazon
(AWS re:Invent 2022: Bewährte Überwachungsmethoden bei Amazon)
Zugehörige Beispiele:
-
Well-Architected Labs - Dependency Monitoring
(Well-Architected Labs – Überwachung von Abhängigkeiten)
Zugehörige Services: