OPS10-BP07 Automatisieren von Reaktionen auf Ereignisse
Die Automatisierung von Reaktionen auf Ereignisse ist der Schlüssel für eine schnelle, konsistente und fehlerfreie operative Abwicklung. Erstellen Sie optimierte Prozesse und verwenden Sie Tools, um Ereignisse automatisch zu verwalten und darauf zu reagieren, um manuelle Eingriffe zu minimieren und die betriebliche Effizienz zu steigern.
Gewünschtes Ergebnis:
-
weniger menschliche Fehler und schnellere Lösungszeiten durch Automatisierung
-
konsistente und zuverlässige Handhabung betrieblicher Ereignisse
-
verbesserte betriebliche Effizienz und Systemzuverlässigkeit
Typische Anti-Muster:
-
manuelle Behandlung von Ereignissen führt zu Verzögerungen und Fehlern
-
bei sich wiederholenden, kritischen Aufgaben wird die Automatisierung übersehen
-
sich wiederholende, manuelle Aufgaben führen zu Ermüdungserscheinungen und zum Übersehen kritischer Probleme
Vorteile der Nutzung dieser bewährten Methode:
-
beschleunigte Reaktionen auf Ereignisse, wodurch sich die Ausfallzeiten des Systems reduzieren
-
zuverlässiger Betrieb mit automatisierter und konsistenter Ereignisbehandlung
Risikostufe bei fehlender Befolgung dieser bewährten Methode: Mittel
Implementierungsleitfaden
Integrieren Sie Automatisierung, um effiziente Arbeitsabläufe zu schaffen und manuelle Eingriffe zu minimieren.
Implementierungsschritte
-
Identifizieren von Möglichkeiten zur Automatisierung: Bestimmen Sie sich wiederholende Aufgaben für die Automatisierung, wie beispielsweise Problembehebung, Ticketverbesserung, Kapazitätsmanagement, Skalierung, Bereitstellung und Tests.
-
Identifizieren von Automatisierungsaufforderungen:
-
Bewerten und definieren Sie bestimmte Bedingungen oder Metriken, die automatische Reaktionen mithilfe von Amazon CloudWatch-Alarmaktionenauslösen.
-
Verwendung von Amazon EventBridge,
um auf Ereignisse in AWS-Services, benutzerdefinierten Workloads und SaaS-Anwendungen zu reagieren. -
Denken Sie an Initiationsereignisse wie bestimmte Protokolleinträge, Schwellenwerte für Leistungsmetrikenoder Zustandsänderungen in AWS-Ressourcen.
-
-
Implementieren der ereignisgesteuerten Automatisierung:
-
Verwenden Sie AWS Systems Manager-Automation-Runbooks, um die Wartung, Bereitstellung und Problembehebung zu vereinfachen.
-
Beim Erstellen von Vorfällen in Incident Manager werden automatisch Details zu den betroffenen AWS-Ressourcen erfasst und dem Vorfall hinzugefügt.
-
Überwachen Sie Quoten proaktiv mit Quota Monitor für AWS
. -
Passen Sie die Kapazität mit AWS Auto Scaling
automatisch an, um Verfügbarkeit und Leistung aufrechtzuerhalten. -
Automatisieren Sie Entwicklungspipelines mit Amazon CodeCatalyst
. -
Führen Sie Smoke Tests durch oder überwachen Sie Endpunkte und APIs kontinuierlich mit synthetischer Überwachung.
-
-
Schadensbegrenzung durch Automatisierung:
-
Implementieren Sie automatisierte Sicherheitsmaßnahmen,
um schnell auf Risiken zu reagieren. -
Verwenden Sie AWS Systems Manager State Manager, um Konfigurationsabweichungen zu reduzieren.
-
Korrigieren Sie nicht konforme Ressourcen mit AWS-Config-Regeln.
-
Aufwand für den Implementierungsplan: Hoch
Ressourcen
Zugehörige bewährte Methoden:
Zugehörige Dokumente:
Zugehörige Videos:
Zugehörige Beispiele: