

# OPS08-BP04 Création d’alertes exploitables
<a name="ops_workload_observability_create_alerts"></a>

 Il est crucial de détecter rapidement les écarts de comportement de votre application et d’y réagir rapidement. Il est particulièrement important de savoir quand les résultats basés sur les indicateurs clés de performance (KPI) sont menacés ou lorsque des anomalies inattendues surviennent. Le fait de baser les alertes sur les KPI garantit que les signaux que vous recevez sont directement liés à l’impact commercial ou opérationnel. Cette approche des alertes exploitables favorise les réponses proactives et contribue à maintenir les performances et la fiabilité du système. 

 **Résultat souhaité :** vous recevez des alertes opportunes, pertinentes et exploitables qui permettent d’identifier et d’atténuer rapidement les problèmes potentiels, en particulier lorsque les résultats basés sur les KPI sont menacés. 

 **Anti-modèles courants :** 
+  Configurer un trop grand nombre d’alertes non critiques, ce qui entraîne de la lassitude. 
+  Ne pas hiérarchiser les alertes en fonction des KPI, ce qui complique la compréhension de l’impact commercial des problèmes. 
+  Négliger de traiter les causes profondes, ce qui entraîne des alertes répétitives pour le même problème. 

 **Avantages de la mise en place de cette bonne pratique :** 
+  Réduction de la lassitude liée aux alertes grâce à des alertes pertinentes et exploitables. 
+  Disponibilité et fiabilité du système améliorées grâce à la détection et à l’atténuation proactives des problèmes. 
+  Collaboration d’équipe améliorée et résolution plus rapide des problèmes grâce à l’intégration à des outils connus d’alerte et de communication. 

 **Niveau de risque exposé si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 Pour créer un mécanisme d’alerte efficace, il est essentiel d’utiliser des métriques, des journaux et des données de suivi qui signalent les risques liés aux résultats basés sur les KPI ou les anomalies détectées. 

### Étapes d’implémentation
<a name="implementation-steps"></a>

1.  **Déterminez les indicateurs de performance clés (KPI)** : identifiez les KPI de votre application. Les alertes doivent être liées à ces KPI afin de refléter avec précision l’impact commercial. 

1.  **Mettez en œuvre la détection des anomalies** : 
   +  **Utilisez la détection des anomalies Amazon CloudWatch** : configurez la [détection des anomalies Amazon CloudWatch](https://docs.aws.amazon.com/Amazon/latest/monitoring/_Anomaly_Detection.html) pour détecter automatiquement les tendances inhabituelles, ce qui vous permet de ne générer des alertes que pour les anomalies réelles. 
   +  **Utilisez AWS X-Ray Insights** : 

     1.  Configurez [X-Ray Insights](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) pour détecter les anomalies dans les données de suivi. 

     1.  Configurez les [notifications pour qu’X-Ray Insights](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) soit alerté des problèmes détectés. 
   +  **Intégrez Amazon DevOps Guru** : 

     1.  Exploitez [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) pour ses fonctionnalités de machine learning permettant de détecter les anomalies opérationnelles avec des données existantes. 

     1.  Accédez aux [paramètres de notification](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings) dans DevOps Guru pour configurer des alertes d’anomalie. 

1.  **Mettez en œuvre des alertes exploitables** : concevez des alertes qui fournissent des informations adéquates pour une action immédiate. 

   1.  Surveillez les [événements AWS Health à l’aide de règles Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html) ou intégrez-les par programmation à l’API AWS Health pour automatiser les actions lorsque vous recevez des événements AWS Health. Il peut s’agir d’actions générales, telles que l’envoi de tous les messages relatifs aux événements du cycle de vie planifiés vers une interface de discussion, ou d’actions spécifiques, telles que le lancement d’un flux de travail dans un outil de gestion des services informatiques. 

1.  **Réduisez la lassitude liée aux alertes** : minimisez les alertes non critiques. Lorsque les équipes sont submergées par de nombreuses alertes insignifiantes, elles peuvent finir par ignorer des problèmes critiques, ce qui diminue l’efficacité globale du mécanisme d’alerte. 

1.  **Configurez des alarmes composites** : utilisez des [alarmes Amazon CloudWatch composites](https://aws.amazon.com/bloprove-monitoring-efficiency-using-amazon-cloudwatch-composite-alarms-2/) pour regrouper plusieurs alarmes. 

1.  **Intégrez des outils d’alerte** : intégrez des outils comme [Ops Genie](https://www.atlassian.com/software/opsgenie) et [PagerDuty](https://www.pagerduty.com/). 

1.  **Intégrez Amazon Q Developer in chat applications** : intégrez [Amazon Q Developer in chat applications](https://aws.amazon.com/chatbot/) pour transmettre des alertes à Amazon Chime, Microsoft Teams et Slack. 

1.  **Alerte basée sur les journaux** : utilisez des [filtres de métriques de journal](https://docs.aws.amazon.com/Amazon/latest/logs/MonitoringLogData.html) dans CloudWatch pour créer des alarmes basées sur des événements de journal spécifiques. 

1.  **Vérifiez et répétez** : revoyez et affinez régulièrement les configurations d’alerte. 

 **Niveau d’effort du plan d’implémentation :** moyen 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 
+  [OPS04-BP01 Identification des indicateurs clés de performance](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Mise en œuvre de la télémétrie de l'application](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Mise en œuvre de la télémétrie de l'expérience utilisateur](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Mise en œuvre de la télémétrie des dépendances](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Mise en œuvre du suivi distribué](ops_observability_dist_trace.md) 
+  [OPS08-BP01 Analyse des métriques de charge de travail](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Analyse des journaux de charge de travail](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Analyse des données de suivi de la charge de travail](ops_workload_observability_analyze_workload_traces.md) 

 **Documents connexes :** 
+  [Utilisation d’alarmes Amazon CloudWatch](https://docs.aws.amazon.com/Amazon/latest/monitoring/AlarmThatSendsEmail.html) (langue française non garantie) 
+  [Création d’une alarme composite](https://docs.aws.amazon.com/Amazon/latest/monitoring/Create_Composite_Alarm.html) 
+  [Création d’une alarme CloudWatch basée sur la détection d’anomalies](https://docs.aws.amazon.com/Amazon/latest/monitoring/Create_Anomaly_Detection_Alarm.html) 
+  [DevOps Guru Notifications](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html) 
+  [X-ray insights notifications](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) 
+  [Surveiller, gérer et dépanner vos ressources AWS grâce au ChatOps interactif](https://aws.amazon.com/chatbot/) 
+  [Amazon CloudWatch Integration Guide \| PagerDuty](https://support.pagerduty.com/docs/amazon-cloudwatch-integration-guide) 
+  [Intégrer OpsGenie à Amazon CloudWatch](https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-amazon-cloudwatch/) 

 **Vidéos connexes :** 
+  [Create Composite Alarms in Amazon CloudWatch](https://www.youtube.com/watch?v=0LMQ-Mu-ZCY) 
+  [Amazon Q Developer in chat applications Overview](https://www.youtube.com/watch?v=0jUSEfHbTYk) 
+  AWS[ on Air ft. Mutative Commands in Amazon Q Developer in chat applications](https://www.youtube.com/watch?v=u2pkw2vxrtk) 

 **Exemples connexes :** 
+  [Alarmes, gestion des incidents et résolution dans le cloud avec Amazon CloudWatch](https://aws.amazon.com/bloarms-incident-management-and-remediation-in-the-cloud-with-amazon-cloudwatch/) 
+  [Tutoriel : création d’une règle Amazon Q Developer in chat applications qui envoie des notifications à Amazon EventBridge](https://docs.aws.amazon.com/chatbot/latest/adminguide/create-eventbridge-rule.html) 
+  [Un atelier sur l’observabilité](https://catalog.workshops.aws/observability/en-US/intro) 