Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Vereinheitlichte Abläufe Erste Schritte: Integrieren Sie kritische Alarme für ein schnelles Incident-Management
Um Sie schnell über kritische Vorfälle zu informieren, führen Sie die folgenden Schritte aus, um Ihre Alarme in die Erkennung und Reaktion von AWS Vorfällen zu integrieren
Definieren und konfigurieren Sie Ihre kritischen Alarme für ein schnelles Incident-Management. Ausführliche Informationen finden Sie unter Definieren und Konfigurieren von Alarmen in Incident Detection and Response im Benutzerhandbuch für Incident Detection and Response.
-
Schritte zur Einrichtung von Alarmen mit Amazon CloudWatch finden Sie unter Definieren und Konfigurieren von Alarmen in Incident Detection and Response im Incident Detection and Response User Guide. AWS Empfehlungen zu kritischen Alarmtypen für verschiedene AWS-Services Arten finden Sie unter Incident Detection and Response (IDR)
. Wenden Sie sich an Ihr AWS Unified Operations-Team AWS , wenn Sie die Erstellung kritischer AWS Alarme für Ihre markierten AWS Ressourcen automatisieren möchten. -
Informationen zur Weiterleitung oder Aufnahme kritischer Alarme von APM-Tools von Drittanbietern mit direkter EventBridge Amazon-Integration
, wie z. B., usw. DataDog NewRelic, finden Sie unter Erfassen von Alarmen, APMs die direkt mit Amazon integriert sind, EventBridge im AWS Incident Detection and Response User Guide. Sie müssen eine Reihe von AWS Ressourcen (AWS Lambda und Amazon EventBridge Event Bus-Regeln) bereitstellen, um Ihren Alarm (Ereignis) umzuwandeln und an AWS Incident Detection and Response weiterzuleiten. Ihr AWS Unified Operations-Team kann Ihnen helfen, die CloudFormation Vorlage für die Installation dieser Ressourcen bereitzustellen. -
Leiten Sie kritische Alarme von Ihrem benutzerdefinierten Überwachungstool über ein APM-Tool eines Drittanbieters weiter oder nehmen Sie es auf, das nicht direkt mit Amazon integriert ist EventBridge DataDog, z. B. NewRelic, usw. Weitere Informationen finden Sie unter Ingest Alarms von APMs , die direkt mit Amazon integriert sind, EventBridge im AWS Incident Detection and Response User Guide. Sie müssen eine Reihe von AWS Ressourcen (API Gateway AWS Lambda Gateway-Funktionen und Amazon EventBridge Event Bus-Regeln) bereitstellen, um Ihren Alarm (Ereignis) umzuwandeln und an AWS Incident Detection and Response weiterzuleiten. Ihr AWS Unified Operations-Team kann Ihnen helfen, die CloudFormation Vorlage für die Installation dieser Ressourcen bereitzustellen.
-
-
Geben Sie Einzelheiten zur Workload-Architektur, Kontaktinformationen und Runbook-Informationen zu Abhilfemaßnahmen bei kritischen Alarmen an. Führen Sie dazu die folgenden Schritte aus:
Laden Sie den Fragebogen zum Onboarding von Workloads zur Erkennung und Reaktion auf AWS Vorfälle für jede kritische Arbeitslast oder Anwendung sowie den Fragebogen zur Erfassung von Alarmen für jeden einzelnen Workload herunter und füllen Sie ihn aus.
Die Informationen in diesen Fragebögen helfen dem AWS Team bei der Erstellung eines Runbooks zur Behebung von Zwischenfällen. Dieses Runbook ermöglicht es, geeignete Maßnahmen zu ergreifen, um kritische Alarme schnell zu beheben und zu beheben, bevor sie zu Betriebsausfällen führen. Beispiele und Beispielinformationen finden Sie unter Fragebögen zum Onboarding von Workloads und zur Erfassung von Alarmen in Incident Detection and Response. AWS
Bieten Sie Zugriff auf Ihre kritischen Alarme zur Erkennung und Reaktion auf Vorfälle AWS
Nutzen Sie die
AWSServiceRoleForHealth_EventProcessorService-Linked Role (SLR) bei der AWS-Konto Ausführung kritischer Workloads, die vom AWS Incident-Management-Team überwacht werden sollen. Weitere Informationen finden Sie unter Zugriff auf die Erfassung von Warnmeldungen für AWS Incident Detection and Response bereitstellen.Anmerkung
Um Sie beim Onboarding großer Geräte zu unterstützen AWS-Konten, AWS kann ich Ihnen ein AWS Command Line Interface Skript zur Verfügung stellen, mit dem Sie die Bereitstellung dieser Spiegelreflexkamera beschleunigen können.
(Optional) Wenn sich Ihre Alarme in Amazon befinden CloudWatch, stellen Sie sicher, dass der AWS Identity and Access Management Benutzer oder die Rolle, die für die Alarmtests (vor dem Go-Live) verwendet wird, über die
cloudwatch:SetAlarmStateIAM-Berechtigung in Ihrem System verfügt AWS-Konto , das den kritischen Workload ausführt. Dies ist für Alarmtests (Spieltag) nach dem Onboarding erforderlich. Weitere Informationen findest du unter Testen integrierter Workloads in Incident Detection and Response. AWS
Erstellen Sie einen Kundenvorgang, AWS Support um einen Workload für ein schnelles Incident-Management zu abonnieren. Beachten Sie, dass Ihr AWS-Konto System automatisch für die schnelle Verwaltung eingehender Vorfälle aktiviert ist. Das bedeutet, dass Sie einen Fall über die Support Center-Konsole, das oder das AWS SDK in die Warteschlange für Unified Operations Incident Detection and Response aufnehmen können AWS Command Line Interface, um schnell reagieren zu können. AWS Um Vorfälle mit ausgehenden Anfragen proaktiv zu überwachen und zu erstellen, erstellen Sie einen AWS Support AWS Support Fall für Ihre kritische Arbeitslast. Führen Sie dazu die folgenden Schritte aus:
Melden Sie sich bei an AWS Support Center Console
, wählen Sie Kundenvorgang erstellen und anschließend Technischer Support aus. Wählen Sie für Service die Option Incident Detection and Response aus.
Wählen Sie als Kategorie die Option Neuen Workload einbinden aus.
Wählen Sie unter Schweregrad die Option Allgemeine Hinweise aus.
Die Fragebögen zur Arbeitslast und zum Alarm, die Sie im vorherigen Schritt ausgefüllt haben, sind beigefügt.