Opérations unifiées Mise en route : intégrez les alarmes critiques pour une gestion rapide des incidents - AWS Support

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Opérations unifiées Mise en route : intégrez les alarmes critiques pour une gestion rapide des incidents

Pour vous avertir rapidement des incidents critiques, suivez les étapes suivantes pour intégrer vos alarmes à la détection et à la réponse aux AWS incidents

  1. Définissez et configurez vos alarmes critiques pour une gestion rapide des incidents. Pour des informations détaillées, voir Définition et configuration des alarmes dans la section Détection et réponse aux incidents du Guide de l'utilisateur sur la détection et la réponse aux incidents.

    1. Pour connaître les étapes de configuration des alarmes à l'aide d'Amazon CloudWatch, consultez la section Définition et configuration des alarmes dans la section Détection et réponse aux incidents du guide de l'utilisateur sur la détection et la réponse aux incidents. Pour obtenir AWS des recommandations sur les types d'alarmes critiques pour différents types Services AWS, consultez la section Détection et réponse aux incidents (IDR). Contactez votre équipe des opérations AWS unifiées si vous AWS souhaitez automatiser la création d' AWS alarmes critiques pour vos AWS ressources étiquetées.

    2. Pour rediriger ou ingérer des alarmes critiques provenant d'outils APM tiers directement intégrés à Amazon EventBridge , tels que,, etc. DataDog NewRelic, consultez la section Ingestion des alarmes directement intégrées à Amazon EventBridge dans le guide de APMs l'utilisateur sur la détection et la réponse aux AWS incidents. Vous devez déployer un ensemble de AWS ressources (AWS Lambda et les règles du bus d' EventBridge événements Amazon) pour transformer et rediriger votre alarme (événement) vers AWS Incident Detection and Response. Votre équipe des opérations AWS unifiées peut vous aider à fournir le CloudFormation modèle pour installer ces ressources.

    3. Redirigez ou ingérez les alarmes critiques depuis votre outil de surveillance personnalisé via un outil APM tiers qui n'est pas directement intégré à Amazon EventBridge, tel que DataDog NewRelic,, etc. Pour plus d'informations, consultez la section Ingestion des APMs alarmes directement intégrées à Amazon EventBridge dans le guide de l'utilisateur sur la détection et la réponse aux AWS incidents. Vous devez déployer un ensemble de AWS ressources ( AWS Lambda fonctions API Gateway et règles du bus d' EventBridge événements Amazon) pour transformer et rediriger votre alarme (événement) vers AWS Incident Detection and Response. Votre équipe des opérations AWS unifiées peut vous aider à fournir le CloudFormation modèle pour installer ces ressources.

  2. Fournissez les détails de l'architecture de la charge de travail, les informations du point de contact et les informations du manuel sur les mesures d'atténuation des alarmes critiques. Pour y arriver, exécutez les étapes suivantes.

    1. Téléchargez et complétez le questionnaire d'intégration de la charge de travail de détection et de réponse aux AWS incidents pour chaque charge de travail ou application critique et le questionnaire d'ingestion d'alarmes associé à chaque charge de travail unique.

      Les informations contenues dans ces questionnaires aident l' AWS équipe à élaborer un manuel de résolution des incidents. Ce manuel permet de prendre les mesures appropriées pour dépanner et corriger rapidement les alarmes critiques avant qu'elles n'entraînent une interruption de l'activité. Pour obtenir des exemples et des informations, consultez les questionnaires d'intégration de la charge de travail et d'ingestion d'alarmes dans AWS Incident Detection and Response.

  3. Donnez accès à vos alarmes critiques intégrées à la détection et à la réponse aux AWS incidents

    1. Déployez le rôle AWSServiceRoleForHealth_EventProcessor lié au service (SLR) dans votre Compte AWS gestion de la charge de travail critique à surveiller par l'équipe de gestion des AWS incidents. Pour plus d'informations, voir Fournir un accès pour l'ingestion d'alertes à la détection et à la réponse aux AWS incidents.

      Note

      Pour vous aider à intégrer un grand nombre de Comptes AWS personnes, je AWS peux vous fournir un AWS Command Line Interface script pour accélérer le provisionnement de ce reflex.

    2. (Facultatif) Si vos alarmes se trouvent sur Amazon CloudWatch, assurez-vous que l' Gestion des identités et des accès AWS utilisateur ou le rôle utilisé pour tester les alarmes (avant la mise en ligne) dispose de l'autorisation cloudwatch:SetAlarmState IAM sur votre compte Compte AWS qui exécute la charge de travail critique. Cela est nécessaire pour tester les alarmes (jour de jeu) après l'intégration. Pour plus d'informations, voir Tester les charges de travail intégrées dans la section Détection et réponse aux AWS incidents.

  4. Créez un AWS Support dossier pour souscrire une charge de travail afin de gérer rapidement les incidents. Notez que vous êtes automatiquement Compte AWS activé pour la gestion rapide des incidents entrants, ce qui signifie que vous pouvez soumettre un dossier à la file d'attente de détection et de réponse aux incidents d'Unified Operations via la console du Centre de Support AWS Command Line Interface, le ou le AWS SDK pour une action rapide. AWS Pour surveiller et créer des incidents de manière proactive avec un AWS Support cas sortant, créez un AWS Support dossier adapté à votre charge de travail critique. Pour y arriver, exécutez les étapes suivantes.

    1. Connectez-vous au AWS Support Center Console, sélectionnez Créer un dossier, puis sélectionnez Support technique.

    2. Pour Service, sélectionnez Incident Detection and Response.

    3. Pour Catégorie, sélectionnez Intégrer une nouvelle charge de travail.

    4. Dans le champ Sévérité, sélectionnez Directives générales.

    5. Vous trouverez ci-joint les questionnaires de charge de travail et d'alarme que vous avez remplis à l'étape précédente.