Application Signals - Amazon CloudWatch

Application Signals

La vigie applicative CloudWatch vous aide à surveiller et à améliorer les performances des applications sur AWS. Il collecte automatiquement les données de vos applications exécutées sur des services tels qu’Amazon EC2, Amazon ECS et Lambda. Vous pouvez utiliser la vigie applicative CloudWatch pour les opérations suivantes :

  • Surveiller l’état des applications en temps réel

  • Suivre les performances par rapport aux objectifs commerciaux

  • Afficher les relations entre les services et les dépendances

  • Identifier et résoudre rapidement les problèmes de performances

  • Activez Application Signals pour collecter automatiquement les métriques et les suivis de vos applications, et afficher les métriques clés telles que le volume des appels, la disponibilité, la latence, les pannes et les erreurs. Visualisez et triez rapidement l’état de fonctionnement actuel, et vérifiez si vos applications atteignent leurs objectifs de performance à long terme, sans écrire de code personnalisé ni créer de tableaux de bord.

  • Créez et surveillez les objectifs de niveau de service (SLO) avec Application Signals. Créez et suivez facilement l’état des SLO liés aux métriques CloudWatch, y compris les nouvelles métriques d’application standard collectées par Application Signals. Consultez et suivez l’état de l’indicateur de niveau de service (SLI) de vos services d’application dans une liste de services et une carte topologique. Créez des alarmes pour suivre vos SLO et suivez les nouvelles métriques d’application standard collectées par Application Signals.

  • Consultez une carte de la topologie de votre application découverte automatiquement par Application Signals, qui vous donne une représentation visuelle de vos applications, de leurs dépendances et de leur connectivité.

  • La vigie applicative fonctionne avec CloudWatch RUM, les canaries CloudWatch Synthetics, AWS Service Catalog AppRegistry et Amazon EC2 Auto Scaling pour afficher vos pages client, vos canaries Synthetics et les noms d’applications dans des tableaux de bord et des cartes.

Langages et architectures pris en charge

La vigie applicative prend en charge les applications Java, Python, Node.js et .NET.

Application Signals est pris en charge et testé sur Amazon EKS, Amazon ECS et Amazon EC2. Sur les clusters Amazon EKS, il découvre automatiquement les noms de vos services et clusters. Sur les autres architectures, vous devez fournir les noms des services et des environnements lorsque vous activez ces services pour Application Signals.

Les instructions pour activer Application Signals sur Amazon EC2 devraient fonctionner sur n’importe quelle architecture qui prend en charge l’agent CloudWatch et AWS Distro for OpenTelemetry. Toutefois, les instructions n’ont pas été testées sur des architectures autres qu’Amazon ECS et Amazon EC2.

Régions prises en charge

La vigie applicative est prise en charge dans toutes les régions commerciales, à l’exception de Canada-Ouest (Calgary).

Fonctionnalités

  • Utiliser la vigie applicative pour la surveillance quotidienne des applications : utilisez la vigie applicative dans la console CloudWatch dans le cadre de la surveillance quotidienne des applications :

    1. Si vous avez créé des objectifs de niveau de service (SLO) pour vos services, commencez par la page Objectifs de niveau de service (SLO). Cela vous permet d’avoir une vue immédiate de l’état de leurs services, opérations et dépendances les plus critiques. Sélectionnez le nom du service, de l’opération ou de la dépendance pour un SLO afin d’ouvrir la page Détails du service et d’afficher des informations détaillées sur le service pendant que vous résolvez les problèmes.

    2. Ouvrez la page Services pour voir un résumé de tous vos services et voir rapidement les services présentant le taux de défaillance ou le temps de latence le plus élevé. Si vous avez créé des SLO, consultez le tableau des services pour voir quels services présentent des indicateurs de niveau de service (SLI) non sains. Si un service particulier est dans un état non sain, sélectionnez-le pour ouvrir la page Détail du service et voir les opérations du service, les dépendances, les scripts canary Synthetics et les demandes des clients. Sélectionnez un point dans un graphique pour voir les suivis corrélés afin de pouvoir résoudre et identifier la cause première des problèmes opérationnels.

    3. Si de nouveaux services ont été déployés ou si les dépendances ont changé, ouvrez la Carte d’application pour inspecter la topologie de votre application. Consultez une carte de vos applications qui montre la relation entre les clients, les scripts canary Synthetics, les services et les dépendances. Consultez rapidement l’état du SLI, les métriques clés telles que le volume d’appels, le taux de défaillance et la latence, et effectuez une analyse approfondie pour obtenir des informations plus détaillées dans la page de Détails du service.

    L’utilisation d’Application Signals entraîne des frais. Pour plus d’informations sur la tarification CloudWatch, veuillez consulter Tarification Amazon CloudWatch.

    Note

    Il n’est pas nécessaire d’activer Application Signals pour utiliser CloudWatch Synthetics, CloudWatch RUM ou CloudWatch Evidently. Cependant, Synthetics et CloudWatch RUM fonctionnent avec Application Signals pour offrir des avantages lorsque vous utilisez ces fonctionnalités ensemble.

  • Vigie applicative entre comptes : grâce à l’observabilité entre comptes la vigie applicative, vous pouvez surveiller et dépanner vos applications qui couvrent plusieurs comptes AWS au sein d’une même région.

    Vous pouvez utiliser Amazon CloudWatch Observability Access Manager pour configurer un ou plusieurs de vos comptes AWS en tant que compte de surveillance. Vous allez permettre au compte de surveillance de consulter les données de votre compte source en créant un récepteur dans votre compte de surveillance. Vous utilisez le récepteur pour créer un lien entre votre compte source et votre compte de surveillance. Pour de plus amples informations, consultez Observabilité inter-comptes CloudWatch.

    Pour que l’observabilité entre comptes de la vigie applicative fonctionne correctement, assurez-vous que les types de télémétrie suivants sont partagés via le gestionnaire d’accès à l’observabilité CloudWatch.

    • Services de la vigie applicative et objectifs de niveau de service (SLO)

    • Métriques dans Amazon CloudWatch

    • Groupes de journaux dans Amazon CloudWatch Logs

    • Traces dans AWS X-Ray

  • Regroupement et filtrage dynamiques des services : regroupez et filtrez les services grâce aux capacités de regroupement dynamique de la vigie applicative. Agrégez automatiquement les métriques et les SLI des services au sein des groupes, ce qui vous permet de partir d’une vue de groupe et d’approfondir des domaines problématiques spécifiques. La vigie applicative détecte et regroupe automatiquement les services en fonction de leur configuration et de leurs relations. Vous pouvez également créer des groupes personnalisés qui correspondent à vos besoins commerciaux. Par exemple, vous pouvez regrouper les services par unités commerciales, équipes ou niveaux critiques. Affichez des métriques de performance consolidées, suivez les SLI au niveau du groupe et identifiez rapidement les services non performants. Grâce au regroupement, vous pouvez organiser vos services distribués à grande échelle en groupes logiques qui correspondent à vos besoins opérationnels et simplifient leur surveillance, en particulier lors d’incidents.

    Le système analyse le graphique de dépendance des services et crée des groupes dont le nom correspond au nœud racine (un service sans dépendances en amont). Tous les services qui dépendent directement ou indirectement de ce service racine sont automatiquement inclus dans le groupe. Par exemple, si le service A appelle le service B, qui à son tour appelle le service C, les trois services seront regroupés avec le service A comme nom de groupe, car il s’agit de la racine de la chaîne de dépendance. Ce mécanisme de regroupement automatique offre un moyen naturel de visualiser et de gérer les services associés en fonction de leurs interactions et dépendances réelles lors de l’exécution.

    Créez des regroupements personnalisés en balisant AWS ou en utilisant des attributs OpenTelemetry qui correspondent à la structure de votre équipe, à vos domaines d’activité ou à vos exigences opérationnelles. Les regroupements personnalisés vous permettent d’organiser les services en fonction de vos flux de travail spécifiques de surveillance et de dépannage. Pour de plus amples informations, consultez Configuration de groupes personnalisés.

  • Suivi du dernier déploiement : vous pouvez suivre le dernier déploiement de chaque service et de ses dépendances, ce qui fournit un contexte essentiel pour le dépannage sans aucune configuration ou installation manuelle. Identifiez et surveillez la dernière heure de déploiement de chaque service et de ses dépendances, ce qui fournit un contexte essentiel pour l’analyse opérationnelle et le dépannage sans configuration ou installation supplémentaire. Corrélation des heures de déploiement avec les changements de performances, détection des problèmes liés au déploiement et conservation d’un historique complet des déploiements dans votre environnement applicatif. Cette fonctionnalité aide les équipes à déterminer rapidement si les déploiements récents ont contribué à la dégradation du service et permet une résolution plus rapide des incidents.

    La vigie applicative corrèle automatiquement les événements de déploiement avec les mesures de performance, vous aidant à identifier rapidement si les déploiements récents contribuent à des problèmes de service. Le système suit le calendrier des déploiements et fournit des indicateurs visuels lorsque les changements de performance correspondent aux activités de déploiement.

    Conservez une vue d’ensemble complète des activités de déploiement dans votre environnement applicatif. Affichez la fréquence des déploiements, les modèles de timing et les taux de réussite afin d’optimiser vos stratégies de déploiement et d’identifier les facteurs de risque potentiels.

  • Résultats d’audit automatisés : découvrez des informations essentielles grâce aux résultats d’audit automatisés de la vigie applicative, tels que les journaux EMF des métriques RED, les traces et les journaux d’application d’la vigie applicative. Le service analyse vos applications pour signaler ses observations, notamment en identifiant les principales valeurs aberrantes qui ont contribué à la latence, aux défaillances ou aux erreurs, en détectant les problèmes provenant des services de dépendance et en trouvant les informations détaillées sur les erreurs dans le journal d’application afin de mieux comprendre une cause racine. Le système d’audit utilise des analyses avancées pour détecter les modèles, mettre en évidence les inefficacités des ressources et formuler une suggestion de cause racine. Les résultats sont classés par ordre de priorité en fonction de leur gravité et de leur impact potentiel sur l’activité, ce qui permet aux équipes de se concentrer en premier lieu sur les problèmes les plus critiques. Obtenez des recommandations exploitables pour améliorer la fiabilité et les performances du service sans analyse manuelle.