Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Suivis
Amazon OpenSearch Service fournit des fonctionnalités complètes de suivi distribué qui vous aident à comprendre les performances des applications et à diagnostiquer les problèmes liés à votre architecture de microservices. En ingérant OpenTelemetry (OTel) les données de trace avec OpenSearch Ingestion, OpenSearch Service traite et structure automatiquement vos informations de télémétrie, vous donnant ainsi end-to-end une visibilité sur les flux de demandes via vos systèmes distribués.
Traitement et ingestion des données de trace
OpenSearch Ingestion fournit des processeurs spécialisés qui normalisent et enrichissent vos données de trace pendant l'ingestion, garantissant ainsi que votre télémétrie suit des modèles cohérents et est prête à être analysée. Les principaux processeurs pour les données de suivi sont les suivants :
-
service_map— Construit automatiquement des graphes de dépendance des services à partir des relations d'intervalle, montrant comment les demandes circulent entre les services. -
trace_group— Regroupe les étendues associées en groupes de traces logiques en fonction des attributs de plage d'entrée tels que la méthode et le chemin HTTP. -
otel_trace_raw— Traite les données de OpenTelemetry trace brutes et extrait les attributs de span, les attributs de ressources et les informations sur le périmètre de l'instrumentation dans des champs consultables.
OpenSearch Interface utilisateur et espace de travail d'observabilité
Une fois vos données de suivi ingérées dans Amazon OpenSearch Service, vous utilisez les outils fournis par l'espace de travail d'observabilité Amazon OpenSearch Service dans l' OpenSearch interface utilisateur pour les analyser. L'espace de travail d'observabilité fournit des visualisations et des outils d'analyse spécialisés conçus pour vous aider à comprendre les performances des services, à identifier les goulets d'étranglement et à résoudre les problèmes liés à votre architecture distribuée.
L'espace de travail d'observabilité inclut une vue Services qui affiche les métriques RED (taux, taux d'erreur, durée) pour tous les services instrumentés, ainsi qu'une carte des services interactive indiquant les dépendances et les modèles de communication. La vue Traces vous permet de rechercher des traces spécifiques à l'aide de trace IDs ou de span IDs, puis d'accéder à des graphiques en cascade détaillés et à une analyse de l'étendue pour comprendre le parcours complet des demandes dans votre système.
Fonctionnalités principales
Vue des services
La vue Services fournit une vue d'ensemble complète de l'état et des performances de votre application par le biais de :
-
Tableau de bord des métriques RED — Surveillez le taux (demandes par seconde), le taux d'erreur (pourcentage de demandes ayant échoué) et la durée (percentiles de latence) pour chaque service de votre système distribué. Ces indicateurs vous donnent un aperçu immédiat de l'état du service et vous aident à identifier rapidement la dégradation des performances.
-
Carte des services interactive : visualisez la façon dont vos services communiquent entre eux grâce à un graphe de dépendance généré automatiquement. La carte des services montre les flux de demandes entre les services, ce qui vous aide à comprendre l'architecture de votre système et à identifier les goulets d'étranglement ou les défaillances en cascade.
-
Indicateurs de santé des services : identifiez rapidement les services problématiques en fonction des taux d'erreur et des seuils de latence. Les services sont codés par couleur pour mettre en évidence ceux qui nécessitent une attention immédiate, ce qui permet de hiérarchiser facilement les efforts de dépannage.
-
Boîte de dialogue de corrélation des services : accédez à n'importe quel service pour analyser les journaux et les traces associés. Cette vue intégrée relie les indicateurs de niveau de service aux données de suivi détaillées et aux entrées de journal associées, ce qui permet une analyse plus rapide des causes profondes sans passer d'un outil à l'autre.
Affichage des traces
La vue Traces permet d'étudier en profondeur les demandes individuelles par le biais de votre système distribué :
-
Regroupement des traces par méthode et chemin HTTP : organise automatiquement les traces en groupes logiques en fonction des points de terminaison de l'API, en affichant des indicateurs agrégés tels que la latence moyenne, le taux d'erreur et les tendances des performances au fil du temps. Cela vous permet d'identifier les terminaux qui rencontrent des problèmes et de suivre l'amélioration des performances.
-
Recherche d'ID de trace et d'ID de span : localisez rapidement des traces spécifiques à l'aide d'identifiants de trace ou d'identifiants de span. Cela est particulièrement utile pour étudier les problèmes signalés par les utilisateurs ou pour établir une corrélation avec les journaux d'erreurs contenant un contexte de suivi.
-
Graphiques en cascade : visualisez la chronologie complète d'une demande au fur et à mesure qu'elle circule dans vos services. La vue en cascade indique le calendrier et la durée de l'intervalle, ce qui permet d'identifier facilement les opérations lentes, le traitement séquentiel par rapport au traitement parallèle et le temps passé dans votre système distribué.
-
Vue arborescente avec répartition hiérarchique des intervalles : parcourez les relations parent-enfant entre les intervalles pour comprendre la hiérarchie des appels au sein d'une trace. Cette vue vous permet de voir comment une demande se répartit entre les services et d'identifier les appels de service qui contribuent à la latence globale.
-
Panneau des journaux associés : affichez les journaux survenus au cours de la même période que votre trace, filtrés par service et contexte de trace pertinents. Cette corrélation entre les traces et les journaux améliore considérablement le dépannage en fournissant à la fois le flux de demandes et les journaux détaillés des applications dans une interface unique.
Capacités avancées
-
Analyse des corrélations — Liez facilement les traces, les spans et les services aux journaux correspondants. L'espace de travail d'observabilité met automatiquement en corrélation les données de télémétrie à l'aide du contexte de trace, ce qui vous permet de passer d'une vue à l'autre d'une même demande sans perdre de contexte.
-
Noms d'index personnalisés et prise en charge entre clusters : configurez le OpenSearch service pour lire les données de trace à partir de modèles d'index personnalisés ou sur plusieurs OpenSearch clusters. Cette flexibilité prend en charge les scénarios de déploiement complexes et vous permet d'organiser vos données de télémétrie en fonction de vos besoins opérationnels.
-
Limites configurables de la carte des services : ajustez le nombre de services et de connexions affichés dans la carte des services pour gérer les topologies à grande échelle. Pour les systèmes comportant des centaines de services, vous pouvez filtrer la carte pour vous concentrer sur des sous-ensembles de services spécifiques ou ajuster les limites de rendu pour maintenir les performances.
-
Navigation par mini-carte pour les diagrammes de Gantt : naviguez efficacement sur de grands diagrammes en cascade à l'aide de la vue d'ensemble des mini-cartes. Cette fonctionnalité est particulièrement utile lors de l'analyse de traces comportant de nombreuses étendues, car elle vous permet de passer rapidement d'une section à l'autre de la chronologie.
Traces fournit une at-a-glance visibilité sur les performances des applications sur la base des données du protocole OpenTelemetry (OTel). Il vous aide à comprendre comment les demandes circulent dans votre système distribué en suivant leur end-to-end parcours entre les services.