OPS08-BP04 Définir des références de métriques de charge de travail
L'établissement d'une base de référence pour les métriques de la charge de travail aide à comprendre l'état et les performances de la charge de travail. En utilisant des références, vous pouvez identifier les applications et les composants peu ou trop performants. Une référence de la charge de travail renforce votre capacité à atténuer les problèmes avant qu'ils ne deviennent des incidents. Les bases de référence sont essentielles au développement de modèles d'activité et à la mise en œuvre de la détection des anomalies lorsque les métriques s'écartent des valeurs attendues.
Résultat souhaité :
-
Vous disposez d'un niveau de référence des métriques pour votre charge de travail dans des conditions normales.
-
Vous pouvez déterminer si votre charge de travail fonctionne normalement.
Anti-modèles courants :
-
Après le déploiement d'une nouvelle fonctionnalité, on constate une baisse de la latence des requêtes. Aucune base de référence n'a été établie pour une métrique composite des requêtes entrantes traitées et de la latence globale. Vous n'êtes pas en mesure de déterminer si la modification a entraîné une amélioration ou si elle a provoqué une défaillance.
-
Un pic soudain d'activité des utilisateurs se produit, mais vous n'avez pas établi de base de référence pour les métriques. Le pic d'activité conduit lentement à une fuite de mémoire dans une application. Cela finit par mettre votre charge de travail hors ligne.
Avantages liés au respect de cette bonne pratique :
-
Vous comprenez le schéma normal d'activité de votre charge de travail à l'aide de métriques pour les composants et applications clés.
-
Vous pouvez déterminer si votre charge de travail, ses applications et ses composants se comportent normalement ou s'ils nécessitent une intervention.
Niveau de risque exposé si cette bonne pratique n'est pas respectée : moyen
Directives d'implémentation
Utilisez les données historiques pour établir une base de référence des métriques de la charge de travail pour les applications et les composants de votre charge de travail. Exploitez la base de référence des métriques lors des réunions d'examen des métriques et du dépannage. Examinez périodiquement les performances de la charge de travail et ajustez la base de référence en fonction de l'évolution de l'architecture.
Exemple de client
Des bases de référence sont établies pour tous les composants et applications de AnyCompany Retail. À partir de données historiques, AnyCompany Retail a élaboré ses bases de référence pour les métriques de la charge de travail sur une période de deux mois. Tous les deux mois, les équipes réévaluent les bases de référence et les ajustent en fonction des données réelles.
Étapes d'implémentation
-
En partant des métriques de la charge de travail, établissez une base de référence pour les composants et les applications clés à l'aide de données historiques. Limitez le nombre de métriques par composant ou application et évitez la lassitude liée à la surveillance de ces indicateurs.
-
Vous pouvez utiliser Amazon CloudWatch Metrics Insights pour interroger des métriques à grande échelle et identifier des tendances et des modèles.
-
La détection des anomalies Amazon CloudWatch utilise des algorithmes de machine learning pour identifier des modèles de comportement pour des métriques, déterminer des références et faire apparaître des anomalies.
-
Amazon DevOps Guru permet de détecter les problèmes opérationnels de votre charge de travail grâce au machine learning.
-
Les clients bénéficiant d'un forfait Enterprise Support peuvent demander un Building a Monitoring Strategy Workshop
(Atelier sur l'élaboration d'une stratégie de suivi) à leur gestionnaire de compte technique. Cet atelier vous aidera à élaborer une stratégie d'observabilité pour votre charge de travail.
-
-
Mettez en place un mécanisme pour passer en revue périodiquement les bases de référence des métriques de la charge de travail, en particulier avant les événements importants de l'entreprise. Au moins une fois par trimestre, évaluez la base de référence de vos métriques de charge de travail à l'aide de données historiques. Utilisez la base de référence dans vos réunions de révision des métriques.
Niveau d'effort du plan d'implémentation : faible. Après avoir établi les métriques de la charge de travail, l'établissement de bases de référence peut vous obliger à collecter suffisamment de données pour identifier des modèles de comportement normaux.
Ressources
Bonnes pratiques associées :
-
OPS08-BP02 Définir les métriques de la charge de travail - Il faut d'abord établir les métriques de la charge de travail avant de déterminer les bases de référence.
-
OPS08-BP03 Collecter et analyser les métriques de charge de travail - Il est nécessaire de collecter et d'analyser les métriques de la charge de travail avant d'établir les bases de référence des métriques.
-
OPS08-BP05 Découvrir des modèles d'activité attendus pour la charge de travail - Cette bonne pratique s'appuie sur la base de référence pour développer des tendances d'utilisation.
-
OPS08-BP06 Signaler les menaces pesant sur les résultats de la charge de travail - Les bases de référence des métriques sont nécessaires pour identifier les seuils et développer des alertes.
-
OPS08-BP07 Signaler la détection d'anomalies dans la charge de travail - La détection des anomalies nécessite l'établissement de bases de référence métriques.
Documents connexes :
-
AWS Observability Best Practices - Alarms
(Bonnes pratiques AWS en matière d'observabilité : alarmes) -
How to set up CloudWatch Anomaly Detection to set dynamic alarms, automate actions, and drive online sales
(Comment configurer CloudWatch Anomaly Detection pour définir des alarmes dynamiques, automatiser des actions et stimuler les ventes en ligne) -
Operationalizing CloudWatch Anomaly Detection
(Opérationnalisation de la détection d'anomalies de CloudWatch)
Vidéos connexes :
-
AWS re:Invent 2020: Monitoring production services at Amazon
-
AWS re:Invent 2021- Get insights from operational metrics at scale with CloudWatch Metrics Insights
-
AWS re:Invent 2022 - Developing an observability strategy (COP302)
-
AWS Summit DC 2022 - Monitoring and observability for modern applications
(Sommet AWS DC 2022 : surveillance et observabilité pour les applications modernes) -
Sommet AWS SF 2022 : L'observabilité et la surveillance des applications avec AWS (COP310)
Exemples connexes :
-
AWS CloudTrail and Amazon CloudWatch Integration Workshop
(Atelier d'intégration d'AWS CloudTrail et Amazon CloudWatch)
Services associés :