追蹤 - Amazon OpenSearch Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

追蹤

Amazon OpenSearch Service 提供全方位的分散式追蹤功能,可協助您了解應用程式效能,並診斷微服務架構的問題。透過使用 OpenSearch Ingestion 擷取 OpenTelemetry (OTel) 追蹤資料,OpenSearch Service 會自動處理和建構您的遙測資訊,讓您端對端 end-to-end 掌握透過分散式系統的請求流程。

追蹤資料處理和擷取

OpenSearch Ingestion 提供專門的處理器,可在擷取期間標準化和豐富追蹤資料,確保您的遙測遵循一致的模式並準備好進行分析。追蹤資料的關鍵處理器包括:

  • service_map – 從跨關係自動建置服務相依性圖表,顯示請求如何在服務之間流動。

  • trace_group – 根據 HTTP 方法和路徑等項目範圍屬性,將相關範圍彙總為邏輯追蹤群組。

  • otel_trace_raw – 處理原始 OpenTelemetry 追蹤資料,並將跨屬性、資源屬性和檢測範圍資訊擷取至可搜尋的欄位。

OpenSearch UI 和可觀測性工作區

將追蹤資料擷取至 Amazon OpenSearch Service 後,您可以使用 OpenSearch UI 中 Amazon OpenSearch Service 可觀測性工作區提供的工具來分析它。 OpenSearch 可觀測性工作區提供專門的視覺化和分析工具,旨在協助您了解服務效能、識別瓶頸,以及對分散式架構的問題進行故障診斷。

可觀測性工作區包含顯示所有檢測服務的 RED 指標 (速率、錯誤率、持續時間) 的服務檢視,以及顯示相依性和通訊模式的互動式服務地圖。追蹤檢視可讓您使用追蹤 IDs 或跨度 IDs 搜尋特定追蹤,然後深入了解詳細的瀑布圖和跨度分析,以了解整個系統的完整請求歷程。

主要功能

服務檢視

服務檢視提供應用程式運作狀態和效能的完整概觀,方法如下:

  • RED 指標儀表板 – 監控分散式系統中每個服務的速率 (每秒請求數)、錯誤率 (失敗請求的百分比) 和持續時間 (延遲百分位數)。這些指標可讓您立即深入了解服務運作狀態,並協助您快速識別效能降低。

  • 互動式服務地圖 – 透過自動產生的相依性圖表,視覺化您的服務如何彼此通訊。服務映射會顯示服務之間的請求流程,協助您了解系統架構並識別瓶頸或串聯失敗。

  • 服務運作狀態指標 – 根據錯誤率和延遲閾值快速識別有問題的服務。服務以顏色編碼,以強調需要立即關注的服務,讓您輕鬆排定故障診斷工作的優先順序。

  • 服務相互關聯對話方塊 – 從任何服務向下切入,以分析相關日誌和追蹤。此整合式檢視會將服務層級指標與詳細的追蹤資料和相關聯的日誌項目連線,在不在不同工具之間切換的情況下,實現更快的根本原因分析。

追蹤檢視

追蹤檢視可讓您透過分散式系統深入調查個別請求:

  • 依 HTTP 方法和路徑進行追蹤分組 – 根據 API 端點自動將追蹤組織到邏輯群組,顯示彙總指標,例如平均延遲、錯誤率和隨時間推移的效能趨勢。這可協助您識別哪些端點遇到問題,並追蹤效能改善。

  • 追蹤 ID 和跨度 ID 搜尋 – 使用追蹤識別符或跨度識別符快速尋找特定追蹤。這在調查使用者報告的問題或與包含追蹤內容的錯誤日誌相關聯時特別有用。

  • 瀑布圖 – 在請求流經您的服務時,將請求的完整時間軸視覺化。瀑布檢視會顯示跨時間和持續時間,讓您輕鬆識別慢速操作、循序與平行處理,以及分散式系統中花費的時間。

  • 具有階層範圍明細的樹狀檢視 – 導覽跨度之間的父子關係,以了解追蹤中的呼叫階層。此檢視可協助您了解請求如何跨服務分支,並識別哪些服務呼叫造成了整體延遲。

  • 關聯的日誌面板 – 檢視與追蹤在相同時間範圍內發生的日誌,依相關服務和追蹤內容篩選。透過在單一界面中提供請求流程和詳細的應用程式日誌,追蹤和日誌之間的這種相互關聯可大幅改善故障診斷。

進階功能

  • 關聯分析 – 將追蹤、跨度和服務與對應的日誌無縫連結。可觀測性工作區會使用追蹤內容自動關聯遙測資料,讓您可以在相同請求的不同檢視之間進行樞紐分析,而不會遺失內容。

  • 自訂索引名稱和跨叢集支援 – 設定 OpenSearch Service 從自訂索引模式或跨多個 OpenSearch 叢集讀取追蹤資料。此彈性支援複雜的部署案例,並可讓您根據營運需求整理遙測資料。

  • 可設定的服務映射限制 – 調整服務映射中顯示的服務和連線數量,以處理大規模拓撲。對於具有數百個服務的系統,您可以篩選映射以專注於特定服務子集,或調整轉譯限制以維持效能。

  • Gantt 圖表的迷你地圖導覽 – 使用迷你地圖概觀有效率地導覽大型追蹤瀑布圖。此功能在分析具有許多範圍的追蹤時特別有用,可讓您快速跳到時間軸的不同區段。

追蹤可根據 OpenTelemetry (OTel) 通訊協定資料提供at-a-glance可見性。它可協助您了解請求如何透過分散式系統,追蹤其跨 服務的end-to-end旅程。