Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Operazioni unificate Guida introduttiva: integra gli allarmi critici per una rapida gestione degli incidenti
Per aiutarti a notificare rapidamente gli incidenti critici, completa i seguenti passaggi per integrare gli allarmi in Incident Detection and Response AWS
Definisci e configura gli allarmi critici per una rapida gestione degli incidenti. Per informazioni dettagliate, consulta Definizione e configurazione degli allarmi in Incident Detection and Response nella Incident Detection and Response User Guide.
-
Per i passaggi per configurare gli allarmi con Amazon CloudWatch, consulta Definisci e configura gli allarmi in Incident Detection and Response nella Incident Detection and Response User Guide. Per AWS consigli sui diversi tipi di allarmi critici Servizi AWS, consulta Incident Detection and Response (IDR)
. Contatta il tuo team AWS Unified Operations se desideri AWS automatizzare la creazione di AWS allarmi critici per le risorse contrassegnate. AWS -
Per reindirizzare o importare allarmi critici da strumenti APM di terze parti con EventBridge integrazione diretta di Amazon
, ad esempio, e così via DataDog NewRelic, consulta la sezione Inserimento di allarmi con integrazione diretta con Amazon EventBridge nella AWS Incident APMs Detection and Response User Guide. È necessario implementare un set di AWS risorse (AWS Lambda e regole Amazon EventBridge Event Bus) per trasformare e reindirizzare l'allarme (evento) verso AWS Incident Detection and Response. Il tuo team AWS Unified Operations può aiutarti a fornire il CloudFormation modello per installare queste risorse. -
Reindirizza o inserisci allarmi critici dal tuo strumento di monitoraggio personalizzato tramite uno strumento APM di terze parti che non ha un'integrazione diretta con Amazon EventBridge, ad esempio, e così DataDog via. NewRelic Per ulteriori informazioni, consulta Ingest alarms from APMs che hanno un'integrazione diretta con Amazon EventBridge nella AWS Incident Detection and Response User Guide. È necessario implementare una serie di AWS risorse ( AWS Lambda funzioni API Gateway e regole del bus di EventBridge eventi Amazon) per trasformare e reindirizzare l'allarme (evento) a AWS Incident Detection and Response. Il tuo team AWS Unified Operations può aiutarti a fornire il CloudFormation modello per installare queste risorse.
-
-
Fornisci dettagli sull'architettura del carico di lavoro, informazioni sui punti di contatto e informazioni sul runbook sulle azioni di mitigazione degli allarmi critici. Per farlo, completa le seguenti fasi.
Scarica e completa il questionario di onboarding del carico di lavoro di rilevamento e risposta agli AWS incidenti per ogni carico di lavoro o applicazione critica e il questionario di inserimento degli allarmi relativo a ciascun carico di lavoro unico.
Le informazioni contenute in questi questionari aiutano il team a sviluppare un manuale per la risoluzione degli incidenti. AWS Questo runbook consente di intraprendere le azioni appropriate per risolvere rapidamente i problemi e correggere gli allarmi critici prima che causino interruzioni dell'attività. Per esempi e informazioni di esempio, consulta i questionari sull'onboarding del carico di lavoro e sull'inserimento degli allarmi in Incident Detection and Response. AWS
Fornisci l'accesso agli allarmi critici integrati al rilevamento e alla risposta agli incidenti AWS
Implementa il ruolo
AWSServiceRoleForHealth_EventProcessorcollegato al servizio (SLR) nell' Account AWS esecuzione del carico di lavoro critico, affinché venga monitorato dal team di gestione degli incidenti. AWS Per ulteriori informazioni, consulta Fornire l'accesso per l'inserimento degli avvisi in Incident Detection and Response. AWSNota
Per aiutarvi nell'onboarding di grandi dimensioni Account AWS, AWS possiamo fornirvi uno AWS Command Line Interface script per velocizzare la fornitura di questa reflex.
(Facoltativo) Se i tuoi allarmi sono in Amazon CloudWatch, assicurati che l' AWS Identity and Access Management utente o il ruolo utilizzato per il test degli allarmi (prima del lancio) disponga dell'autorizzazione
cloudwatch:SetAlarmStateIAM nel tuo account Account AWS che esegue il carico di lavoro critico. È necessario per i test degli allarmi (gameday) dopo l'onboarding. Per ulteriori informazioni, consulta Test dei carichi di lavoro integrati in Incident Detection and Response. AWS
Crea un Supporto AWS caso per sottoscrivere un carico di lavoro per una rapida gestione degli incidenti. Tieni presente che il tuo Account AWS è abilitato automaticamente alla gestione rapida degli incidenti in entrata, il che significa che puoi inoltrare un caso alla coda Unified Operations Incident Detection and Response tramite la console Support Center AWS Command Line Interface, l'o l' AWS SDK per un'azione rapida. AWS Per monitorare e creare incidenti in modo proattivo con un caso in uscita, crea un Supporto AWS caso per il tuo carico di lavoro critico. Supporto AWS Per farlo, completa le seguenti fasi.
Accedi a AWS Support Center Console
, seleziona Crea caso, quindi seleziona Supporto tecnico. Per Assistenza, seleziona Incident Detection and Response.
Per Categoria, seleziona Nuovo carico di lavoro integrato.
Per Severità seleziona Linee guida generali.
In allegato i questionari Workload e Alarm che hai completato nel passaggio precedente.