View a markdown version of this page

概觀 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

概觀

為什麼您需要重新思考可觀測性策略

可觀測性發展自監控,專注於收集遙測訊號,例如日誌、指標和追蹤,以協助您偵錯應用程式。由於這種關聯性,可觀測性通常是事後考量,並導致檢測過多或過少、無法關聯訊號、中斷連線可見性,以及多個工具,這些工具通常無法進行整合。這些導致感知到缺乏價值和成本,似乎超過可觀測性的優勢。從業務角度來看,這些問題意味著識別時間較長 (MTTI)、復原時間較長 (MTTR),以及使用者體驗、信任、品牌評價和收入降低。目前可觀測性不僅與偵錯和診斷應用程式的能力有關,也與驗證應用程式是否完全如預期般運作的能力有關。

想要為使用者提供最佳體驗以及可觀測性工具和功能的演變的企業之間的溝通需要重新考慮可觀測性並重新排定優先順序。

可觀測性工具和架構

在 OpenTelemetry 在 2019 年推出之前,為應用程式效能監控 (APM) 和數位體驗監控 (DEM) 提供可觀測性解決方案的專用工具,使得遙測訊號之間的中斷連線更加可見,並突顯不良的使用者體驗。

  • APM 會即時追蹤和分析軟體應用程式行為。它會測量關鍵指標,例如回應時間、錯誤率和資源使用量,同時監控應用程式元件之間的使用者交易。APM 工具可協助團隊在這些問題影響使用者之前,快速識別效能問題、瓶頸和錯誤。其主要目標是維持最佳應用程式效能和使用者體驗,同時減少解決問題所需的時間。

  • DEM 會測量和分析使用者與數位服務互動的品質。它結合了真實使用者監控 (RUM)、合成監控和端點監控,以提供使用者體驗的完整檢視。DEM 會追蹤指標,例如不同裝置、瀏覽器和位置的頁面載入時間、應用程式回應能力和使用者旅程完成度。這有助於組織了解使用者體驗數位服務的方式、識別影響使用者滿意度的效能問題,以及最佳化數位接觸點。洞見可讓企業做出資料驅動型決策,以改善客戶體驗並維持競爭優勢。

2019 年推出的 OpenTelemetry 為產生、收集、管理和匯出遙測資料 提供了開放原始碼、統一的標準。此架構著重於透過新增內容、提供更好的訊號相互關聯,以及提供更好的衍生值,來橋接遙測訊號之間的差距。例如,使用具有新增內容的結構化日誌可協助您從擷取的日誌衍生指標,並以不同的方式分析資訊,以更快地找到根本原因。在 OpenTelemetry 之前,訊號是單獨檢視的。若要新增功能,您必須修改程式碼,將新維度新增至現有指標或建立新的指標、等待程式碼經過開發生命週期,然後等待在適當的環境中觀察指標,才能進行扣除。此程序會延遲可見性,並在必要時影響您將資料與日誌或追蹤建立關聯的能力。

對 OpenTelemetry 的支援,以及來自此支援的工具改進,可協助您從可觀測性平台獲得更好的價值、增強使用者體驗,並改善營運效率和團隊士氣。

如果您想要改善和增強可觀測性狀態,實際開始的位置和方式為何? 我們建議採用由三個步驟組成的方法,本指南會詳細說明這些步驟: