

# OPS10-BP02 Disposer d’un processus par alerte
<a name="ops_event_response_process_per_alert"></a>

 Il est essentiel d’établir un processus clair et défini pour chaque alerte de votre système afin de garantir une gestion efficace et efficiente des incidents. Cette pratique garantit que chaque alerte entraîne une réponse spécifique et exploitable, améliorant ainsi la fiabilité et la réactivité de vos opérations. 

 **Résultat souhaité :** Chaque alerte déclenche un plan de réponse spécifique et bien défini. Dans la mesure du possible, les réponses sont automatisées, avec une propriété clairement établie et une procédure de remontée définie. Les alertes sont liées à une base de connaissances actualisée afin que chaque opérateur puisse réagir de manière cohérente et efficace. Les réponses sont rapides et uniformes à tous les niveaux, ce qui améliore l’efficacité et la fiabilité opérationnelles. 

 **Anti-modèles courants :** 
+  Les alertes n’ont pas de processus de réponse prédéfini, ce qui entraîne des résolutions improvisées et différées. 
+  En raison de la surcharge d’alertes, celles qui sont importantes sont ignorées. 
+  Les alertes ne sont pas traitées de manière cohérente en raison de l’absence de définition claire de la propriété et des responsabilités. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Réduction de la lassitude liée aux alertes en ne déclenchant que des alertes exploitables. 
+  Diminution du délai moyen de résolution (MTTR) des problèmes opérationnels. 
+  Diminution du délai moyen d’investigation (MTTI), ce qui contribue à réduire le MTTR. 
+  Capacité accrue à adapter les réponses opérationnelles. 
+  Amélioration de la cohérence et de la fiabilité dans la gestion des événements opérationnels. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** Élevé 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 Pour disposer d’un processus par alerte, il est nécessaire d’établir un plan de réponse clair pour chaque alerte, d’automatiser les réponses dans la mesure du possible et d’améliorer continuellement ces processus en fonction des commentaires opérationnels et de l’évolution des exigences. 

### Étapes d’implémentation
<a name="implementation-steps"></a>

 Le schéma suivant illustre le flux de travail de gestion des incidents dans [AWS Systems Manager Incident Manager](https://aws.amazon.com/systems-manager/features/incident-manager/). Il est conçu pour répondre rapidement aux problèmes opérationnels en créant automatiquement des incidents en réponse à des événements spécifiques provenant d’ [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) ou [Amazon EventBridge](https://aws.amazon.com/eventbridge/). Lorsqu’un incident est créé, automatiquement ou manuellement, Incident Manager centralise la gestion de l’incident, organise les informations pertinentes sur les ressources AWS et lance des plans de réponse prédéfinis. Cela inclut l’exécution de runbooks Systems Manager Automation pour une action immédiate, ainsi que la création d’un élément de travail opérationnel parent dans OpsCenter afin de suivre les tâches et les analyses associées. Ce processus rationalisé accélère et coordonne la réponse aux incidents dans l’ensemble de votre environnement AWS. 

![Organigramme illustrant la façon dont Incident Manager fonctionne – Amazon Q Developer in chat applications, les plans et les contacts de remontée, ainsi que les runbooks, sont intégrés aux plans de réponse, qui sont ajoutés aux incidents et aux analyses. Amazon CloudWatch est également pris en compte dans les plans de réponse.](http://docs.aws.amazon.com/fr_fr/wellarchitected/2024-06-27/framework/images/incident-manager-how-it-works.png)


 

1.  **Utilisez des alarmes composites :** Créez [des alarmes composites](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html) dans CloudWatch afin de regrouper les alarmes associées. Cela vous permettra de réduire le bruit et de mettre en place des réponses plus significatives. 

1.  **Intégrez les alarmes Amazon CloudWatch à Incident Manager** Configurez les alarmes CloudWatch de façon à créer automatiquement des incidents dans [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/response-plans.html). 

1.  **Intégrez Amazon EventBridge à Incident Manager :** Créez [des règles EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-create-rule.html) pour réagir aux événements et créer des incidents à l’aide de plans de réponse définis. 

1.  **Préparez-vous aux incidents dans Incident Manager :** 
   +  Établissez [des plans de réponse détaillés](https://docs.aws.amazon.com/incident-manager/latest/userguide/response-plans.html) dans Incident Manager pour chaque type d’alerte. 
   +  Établissez des canaux de discussion via [Amazon Q Developer in chat applications](https://docs.aws.amazon.com/incident-manager/latest/userguide/chat.html) connecté aux plans de réponse dans Incident Manager, afin de faciliter la communication en temps réel lors d’incidents sur des plateformes telles que Slack, Microsoft Teams et Amazon Chime. 
   +  Intégrez [les runbooks Systems Manager Automation](https://docs.aws.amazon.com/incident-manager/latest/userguide/runbooks.html) dans Incident Manager afin de mettre en place des réponses automatisées pour les incidents. 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 
+  [OPS04-BP01 Identification des indicateurs clés de performance](ops_observability_identify_kpis.md) 
+  [OPS08-BP04 Création d’alertes exploitables](ops_workload_observability_create_alerts.md) 

 **Documents connexes :** 
+ [AWS Cloud Adoption Framework: Operations Perspective - Incident and problem management ](https://docs.aws.amazon.com/whitepapers/latest/aws-caf-operations-perspective/incident-and-problem-management.html)
+ [Using Amazon CloudWatch alarms](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)
+ [ Setting up AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/setting-up.html)
+ [ Preparing for incidents in Incident Manager ](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-response.html)

 **Vidéos connexes :** 
+ [ Top incident response tips from AWS](https://www.youtube.com/watch?v=Cu20aOvnHwA)

 **Exemples connexes :** 
+ [ Ateliers AWS – AWS Systems Manager Incident Manager – Automatiser les réponses aux événements de sécurité ](https://catalog.workshops.aws/automate-incident-response/en-US/settingupim/onboarding)