故障診斷 應用程式問題 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

故障診斷 應用程式問題

透過 Application Signals,您可以疑難排解應用程式中很少發生的延遲峰值。啟用交易搜尋並設定擷取 100% 範圍的頭取樣率後,您就可以完全了解任何應用程式問題。下列案例描述 Application Signals 如何與交易範圍搭配使用,以監控您的服務並識別服務品質問題。

故障診斷案例範例

此案例著重於由數個呼叫第三方付款 APIs 的微服務組成的寵物診所應用程式。這些呼叫間歇性地緩慢,因此會影響收入。

Jane 開啟 CloudWatch Application Signals 主控台,並注意到負責註冊客戶的客戶服務應用程式運作狀態良好,不會違反任何 SLOs。

CloudWatch Application Signals 主控台

她開啟服務以調查任何很少發生的失敗模式,並注意到註冊 API 遇到間歇性 p99 延遲峰值。

間歇性延遲峰值

Jane 在延遲圖表中選擇資料點來檢視關聯的範圍。她依客戶 ID 將範圍分組,以檢視受到延遲尖峰影響的所有客戶。

受到延遲激增影響的客戶

Jane 會選取其中一個具有故障狀態的關聯範圍,這會開啟所選追蹤的追蹤詳細資訊頁面。她捲動至客群時間軸區段以遵循呼叫路徑,發現對付款閘道的呼叫失敗,並阻止客戶註冊。

失敗的通話付款