View a markdown version of this page

OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie - AWS Well-Architected Framework

OPS04-BP04 Implementieren einer Abhängigkeitstelemetrie

Entwickeln und konfigurieren Sie Ihren Workload so, dass Sie Informationen zum Status der Ressourcen erhalten, von denen er abhängt. Dies sind Ressourcen, die außerhalb Ihres Workloads liegen. Beispiele für externe Abhängigkeiten können externe Datenbanken, DNS und Netzwerkkonnektivität sein. Verwenden Sie diese Informationen, um festzulegen, wann eine Reaktion erforderlich ist, und geben Sie zusätzlichen Kontext zum Status des Workloads an.

Gewünschtes Ergebnis:

  • Ihr Workload gibt telemetrische Daten zum Status externer Abhängigkeiten aus.

  • Sie werden benachrichtigt, wenn Probleme mit solchen Abhängigkeiten vorliegen.

Typische Anti-Muster:

  • Ihre Benutzer können Ihre Website nicht erreichen. Sie können nicht feststellen, ob der Grund dafür ein DNS-Problem ist, ohne manuell zu überprüfen, ob der Service Ihres DNS-Anbieters funktioniert.

  • Ihre Warenkorb-Anwendung kann keine Transaktionen abschließen. Sie können nicht feststellen, ob dies an einem Problem bei Ihrem Kreditkarten-Verarbeitungsanbieter liegt, ohne bei ihm nachzufragen.

Vorteile der Nutzung dieser bewährten Methode:

  • Die Überwachung externer Abhängigkeiten macht Sie im Voraus auf Probleme aufmerksam.

  • Die Kenntnis des Zustands Ihrer Abhängigkeiten unterstützt die Fehlerbehebung.

Risikostufe, wenn diese bewährte Methode nicht eingeführt wird: mittel

Implementierungsleitfaden

Arbeiten Sie mit den Beteiligten zusammen an der Identifizierung externer Abhängigkeiten Ihres Workloads. Zu diesen können externe Datenbanken, APIs oder die Netzwerkkonnektivität zwischen Ihrem Workload und Ressourcen in anderen Umgebungen gehören. Entwickeln Sie eine Überwachungsstrategie, um über den Zustand von Abhängigkeiten informiert zu sein und proaktiv benachrichtigt zu werden, wenn sich ein Status ändert.

Kundenbeispiel

Der eCommerce-Workload von AnyCompany Retail hängt von einer in einer anderen Umgebung befindlichen Datenbank ab. In jeder Nacht werden Daten in die Datenbank eingelesen, die für die eCommerce-Plattform genutzt werden. Die Verantwortung für die Netzwerkkonnektivität und den Datenbanksupport liegt bei anderen Teams. Das eCommerce-Team hat verschiedene Canary-Alarme konfiguriert, um informiert zu werden, wenn die Netzwerkkonnektivität ausfällt, die Datenbank nicht erreicht werden kann und wenn Aufgaben nicht abgeschlossen werden.

Implementierungsschritte

  1. Identifizieren Sie externe Abhängigkeiten Ihres Workloads. Implementieren Sie Telemetrie, um den Zustand und die Erreichbarkeit solcher Abhängigkeiten zu prüfen.

    1. AWS-Kunden können mit AWS Health Dashboard den Zustand von AWS-Services überwachen und Benachrichtigungen zu Ereignissen erhalten.

    2. Mit Amazon CloudWatch Synthetics können Sie APIs, URLs und Websiteinhalte überwachen.

  2. Richten Sie Alarme ein, die Ihre Organisation darauf aufmerksam machen, wenn eine Abhängigkeit ein Problem aufweist oder nicht erreicht werden kann.

    1. Kunden mit Enterprise Support können bei ihrem Technical Account Manager einen Workshop zum Thema Aufbau einer Überwachungsstrategie anfragen. Ein solcher Workshop hilft bei der Entwicklung einer Überwachungsstrategie für Ihren Workload.

  3. Identifizieren Sie Ansprechpartner für Abhängigkeiten, die bei Problemen verfügbar sind. Dokumentieren Sie, wie Sie sich an Verantwortliche für die Abhängigkeiten wenden können, sowie die Servicevereinbarungen und das Eskalierungsverfahren.

Grad des Aufwands für den Implementierungsplan: mittel. Die Implementierung von Telemetrie für Abhängigkeiten kann das Erstellen eigener Überwachungslösungen erfordern.

Ressourcen

Zugehörige bewährte Methoden:

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele:

Zugehörige Services: