Ablaufverfolgungen - OpenSearch Amazon-Dienst

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Ablaufverfolgungen

Amazon OpenSearch Service bietet umfassende Funktionen zur verteilten Ablaufverfolgung, die Ihnen helfen, die Anwendungsleistung zu verstehen und Probleme in Ihrer gesamten Microservices-Architektur zu diagnostizieren. Durch das Ingesting OpenTelemetry (OTel) -Trace-Daten mit OpenSearch Ingestion verarbeitet und strukturiert OpenSearch Service automatisch Ihre Telemetriedaten, sodass Sie end-to-end Einblick in die Anforderungsflüsse in Ihren verteilten Systemen erhalten.

Verarbeitung und Erfassung von Trace-Daten

OpenSearch Ingestion bietet spezialisierte Prozessoren, die Ihre Trace-Daten während der Aufnahme normalisieren und anreichern. So stellen Sie sicher, dass Ihre Telemetrie konsistenten Mustern folgt und für die Analyse bereit ist. Zu den wichtigsten Prozessoren für Trace-Daten gehören:

  • service_map— Erstellt anhand von Span-Beziehungen automatisch Diagramme zur Abhängigkeit von Diensten, die zeigen, wie Anfragen zwischen Services fließen.

  • trace_group— Fasst verwandte Bereiche auf der Grundlage von Attributen wie HTTP-Methode und Pfad zu logischen Trace-Gruppen zusammen.

  • otel_trace_raw— Verarbeitet rohe OpenTelemetry Trace-Daten und extrahiert Bereichsinformationen zu Span-Attributen, Ressourcenattributen und Informationen zum Instrumentierungsbereich in durchsuchbare Felder.

OpenSearch Benutzeroberfläche und Observability Workspace

Nachdem Ihre Trace-Daten in Amazon OpenSearch Service aufgenommen wurden, verwenden Sie die Tools, die im Amazon OpenSearch Service Observability Workspace in der OpenSearch Benutzeroberfläche bereitgestellt werden, um sie zu analysieren. Der Observability-Arbeitsbereich bietet spezielle Visualisierungen und Analysetools, die Ihnen helfen, die Serviceleistung zu verstehen, Engpässe zu identifizieren und Probleme in Ihrer verteilten Architektur zu beheben.

Der Observability-Workspace umfasst eine Serviceansicht, in der RED-Metriken (Rate, Fehlerrate, Dauer) für alle instrumentierten Services angezeigt werden, sowie eine interaktive Servicekarte, die Abhängigkeiten und Kommunikationsmuster zeigt. In der Traces-Ansicht können Sie mithilfe von Trace IDs oder Span nach bestimmten Traces suchen und anschließend detaillierte Wasserfalldiagramme und Span-Analysen aufrufen IDs, um den gesamten Prozess der Anfrage durch Ihr System nachzuvollziehen.

Wichtigste Funktionen

Dienste anzeigen

Die Serviceansicht bietet einen umfassenden Überblick über den Zustand und die Leistung Ihrer Anwendung durch:

  • RED-Metriken-Dashboard — Überwachen Sie die Rate (Anfragen pro Sekunde), die Fehlerrate (Prozentsatz der fehlgeschlagenen Anfragen) und die Dauer (Latenzperzentile) für jeden Service in Ihrem verteilten System. Diese Metriken geben Ihnen sofortigen Einblick in den Zustand Ihrer Dienste und helfen Ihnen, Leistungseinbußen schnell zu erkennen.

  • Interaktive Servicekarte — Visualisieren Sie anhand eines automatisch generierten Abhängigkeitsdiagramms, wie Ihre Dienste miteinander kommunizieren. Die Service Map zeigt die Anforderungsflüsse zwischen den Diensten und hilft Ihnen so, Ihre Systemarchitektur zu verstehen und Engpässe oder kaskadierende Ausfälle zu identifizieren.

  • Indikatoren für den Dienststatus — Identifizieren Sie schnell problematische Dienste anhand von Fehlerraten und Latenzschwellenwerten. Dienste sind farblich gekennzeichnet, um diejenigen hervorzuheben, die sofortige Aufmerksamkeit erfordern, sodass die Problembehebung leicht priorisiert werden kann.

  • Dialogfeld „Servicekorrelation“ — Analysieren Sie von jedem Service aus die zugehörigen Logs und Traces. Diese integrierte Ansicht verbindet Metriken auf Service-Ebene mit detaillierten Trace-Daten und zugehörigen Protokolleinträgen und ermöglicht so eine schnellere Ursachenanalyse, ohne zwischen verschiedenen Tools wechseln zu müssen.

Ansicht „Traces“

Die Traces-Ansicht ermöglicht eine gründliche Untersuchung einzelner Anfragen über Ihr verteiltes System:

  • Trace-Gruppierung nach HTTP-Methode und -Pfad — Ordnet Traces auf der Grundlage von API-Endpunkten automatisch in logische Gruppen an und zeigt aggregierte Kennzahlen wie durchschnittliche Latenz, Fehlerrate und Leistungstrends im Zeitverlauf. Auf diese Weise können Sie feststellen, an welchen Endpunkten Probleme auftreten, und Leistungsverbesserungen verfolgen.

  • Suche nach Trace-ID und Span-ID — Schnelles Auffinden bestimmter Traces mithilfe von Trace-Identifikatoren oder Span-Identifikatoren. Dies ist besonders nützlich, wenn Sie Probleme untersuchen, die von Benutzern gemeldet wurden, oder wenn sie mit Fehlerprotokollen korrelieren, die den Trace-Kontext enthalten.

  • Wasserfalldiagramme — Visualisieren Sie den gesamten Zeitplan einer Anfrage, während sie Ihre Services durchläuft. In der Wasserfallansicht werden Zeitablauf und Dauer der Zeitspanne angezeigt, sodass Sie auf einfache Weise erkennen können, ob langsame Vorgänge, sequentielle oder parallel Verarbeitung erfolgen und wo in Ihrem verteilten System Zeit verbracht wird.

  • Strukturansicht mit hierarchischer Aufschlüsselung der Spanne — Navigieren Sie durch die übergeordneten und untergeordneten Beziehungen zwischen Bereichen, um die Aufrufhierarchie innerhalb einer Trace zu verstehen. Anhand dieser Ansicht können Sie erkennen, wie sich eine Anfrage dienstübergreifend verzweigt, und feststellen, welche Serviceanfragen zur Gesamtlatenz beitragen.

  • Bereich „Zugeordnete Protokolle“ — Zeigt Protokolle an, die im gleichen Zeitraum wie Ihr Trace aufgetreten sind, gefiltert nach relevantem Service- und Trace-Kontext. Diese Korrelation zwischen Ablaufverfolgungen und Protokollen verbessert die Fehlerbehebung erheblich, da sowohl der Anforderungsablauf als auch detaillierte Anwendungsprotokolle in einer einzigen Oberfläche bereitgestellt werden.

Erweiterte Funktionen

  • Korrelationsanalyse — Verknüpfen Sie Traces, Spans und Services nahtlos mit den entsprechenden Protokollen. Der Observability Workspace korreliert Telemetriedaten automatisch mithilfe des Trace-Kontextes, sodass Sie zwischen verschiedenen Ansichten derselben Anfrage wechseln können, ohne den Kontext zu verlieren.

  • Benutzerdefinierte Indexnamen und clusterübergreifende Unterstützung — Konfigurieren Sie den OpenSearch Service so, dass Trace-Daten aus benutzerdefinierten Indexmustern oder aus mehreren Clustern gelesen werden. OpenSearch Diese Flexibilität unterstützt komplexe Bereitstellungsszenarien und ermöglicht es Ihnen, Ihre Telemetriedaten Ihren betrieblichen Anforderungen entsprechend zu organisieren.

  • Konfigurierbare Service-Map-Grenzwerte — Passen Sie die Anzahl der Dienste und Verbindungen an, die in der Service Map angezeigt werden, um umfangreiche Topologien zu handhaben. Bei Systemen mit Hunderten von Services können Sie die Karte filtern, um sich auf bestimmte Service-Teilmengen zu konzentrieren, oder Rendering-Limits anpassen, um die Leistung aufrechtzuerhalten.

  • Mini-Map-Navigation für Gantt-Diagramme — Mithilfe der Mini-Kartenübersicht können Sie auf effiziente Weise durch große Wasserfalldiagramme navigieren. Diese Funktion ist besonders hilfreich bei der Analyse von Spuren mit vielen Spannweiten, sodass Sie schnell zu verschiedenen Abschnitten der Zeitleiste springen können.

Traces bietet einen at-a-glance Einblick in die Anwendungsleistung auf der Grundlage von OpenTelemetry (OTel) -Protokolldaten. Es hilft Ihnen zu verstehen, wie Anfragen durch Ihr verteiltes System fließen, indem es ihren end-to-end Weg über verschiedene Dienste hinweg verfolgt.