CloudWatch 調查
CloudWatch 調查功能是生成式 AI 助手,可協助您回應系統中的事件。它使用生成式 AI 掃描系統的遙測,並快速呈現可能與您的問題相關的遙測資料和建議。這些建議包括指標、日誌、部署事件,以及當涉及多個資源時附帶視覺化呈現的根本原因假設。如需了解 AI 助手可呈現之完整資料類型的清單,請參閱 CloudWatch 調查功能可在調查中呈現的洞見。
您可以在 CloudWatch 操作疑難排解中執行調查,而無需任何其他組態。當您開始調查時,CloudWatch 調查功能會使用與登入使用者關聯的許可來調查和分析與警示、指標或 Logs Insights 查詢關聯的資源,並提供疑難排解建議。調查不會建立任何資源,CloudWatch 調查功能所採取的每個動作都會記錄在 CloudTrail 中,以利追蹤。調查將為您提供下列資訊,協助您進行操作疑難排解:
-
檢視 AI 產生的觀測資訊、建議和假設
-
存取視覺化呈現的多資源假設
-
檢閱自然語言說明和根本原因分析
-
存取遙測資料的 AI 分析,包括指標、日誌、部署事件、AWS Health 事件、CloudTrail 變更事件、X-Ray 追蹤資料以及 CloudWatch Logs Insights 查詢
設定 CloudWatch 調查將為您提供更深入的調查。
當您設定 CloudWatch 調查時,您的調查將具備以下額外功能:
-
接受或捨棄建議及觀測資訊
對於每個建議,您決定將其新增至調查結果,還是將其捨棄。這有助於 CloudWatch 調查功能精簡並反覆分析,釐清問題的根本原因。CloudWatch 調查功能可協助您確定根本原因,而無需手動識別和查詢多個指標及其他遙測和事件來源。原本需要耗費數小時搜尋並在不同主控台之間切換才能解決的疑難排解問題,如今能在很短的時間內完成。
-
設定跨帳戶存取權
透過 CloudWatch 跨帳戶可觀測性,讓調查能夠從其他來源帳戶收集資料。
-
將新的遙測來源新增至調查
從 CloudTrail 事件歷史記錄新增資料,有助於 CloudWatch 調查功能將問題與變更事件關聯起來。新增 X-Ray 可改善拓撲和應用程式映射。您也可以從 Application Signals 新增資料,深入了解應用程式和服務的運作狀態,將該遙測與其他遙測來源相結合。若您使用 Amazon EKS 叢集,可為 CloudWatch 調查功能提供存取 EKS 資源的權限,藉此針對可能涉及調查問題的叢集資源,提供更細緻的相關資訊。
-
將備註或評論新增至調查結果
能夠為調查結果提供額外的內容,以便在報告或稽核期間提供更全面的觀點。
-
執行建議的執行手冊修復
CloudWatch 調查功能可能建議您使用 Automation 執行手冊嘗試自動解決問題。自動化是另一項 AWS 服務 Systems Manager 中的功能。Automation 執行手冊將定義一系列步驟或動作,以在您選取的資源上執行。每個執行手冊旨在解決特定問題。
-
與團隊成員共用調查結果
若未進行額外設定,調查將與登入使用者的工作階段連結。其他使用者無法檢視調查結果或繼續調查。設定 CloudWatch 調查功能調查後,在帳戶中被授與必要許可的所有使用者皆可使用調查。
-
手動結束、封存或重新開啟調查
在您的帳戶中設定 CloudWatch 調查之前,調查執行一次後即告完成。一旦設定 CloudWatch 調查,調查即可繼續進行直至問題解決。問題解決後,調查會封存。若您已解決問題,但導致調查發生的狀況仍然存在,您可以手動關閉調查。若情況再度出現,您可以重新啟動 (或重新開啟) 調查。
設定 CloudWatch 調查時,系統會在您的帳戶中建立調查群組。每個帳戶可以有一個調查群組,調查群組中最多可同時執行 2 項作用中調查。每個帳戶每月最多可以建立 150 項採用 AI 分析技術的進階調查。調查群組是帳戶層級的組態。在帳戶中建立調查群組時,它會與帳戶中開始的所有調查搭配使用。
注意
當您設定 CloudWatch 調查時,CloudWatch 將使用所提供的 IAM 角色定期掃描您帳戶中的資源,以映射資源和遙測。有些服務 (如 Lambda) 將針對某些與描述或列舉資源相關的 API 呼叫,代表 CloudWatch 調用 KMS 解密 API。系統會執行此背景程序,以確保拓撲反映帳戶及其相依項的最新狀態。無論是否有作用中的調查,此重新整理都會執行。
建立調查的方法
可以透過下列方式建立調查:
-
在眾多 AWS 主控台內。例如,您可以在 CloudWatch 主控台中檢視 CloudWatch 指標或警示時,或透過 Lambda 函式在其屬性頁面上的監視器索引標籤,啟動調查。
-
透過在 CloudWatch 調查的聊天視窗中依循提示操作。您可以先問一些問題,例如:「為什麼我的 Lambda 函式今天速度變慢?」 或者「我的資料庫有什麼問題?」
-
透過設定 CloudWatch 警示動作,在警示進入 ALARM 狀態時自動啟動調查。
了解假設視覺效果
當 CloudWatch 調查產生包含多個資源的假設時,調查檢視會視覺化呈現這些資源之間的因果關係。此視覺化假設檢視可協助您快速了解複雜的問題,而無需閱讀冗長的文字說明。
假設視覺化圖表將資源呈現為節點,這些節點透過 CloudWatch 調查所識別的路徑相互連結。例如,如果假設涉及影響 DynamoDB 資料表 B 的 Lambda 函式 A,您會看到兩個節點視覺化呈現此關聯關係。
假設視覺化圖表的主要功能:
-
資源節點:假設中提及的每個 AWS 資源皆以獨立節點呈現,並標示資源類型與識別碼。
-
連線:節點之間的連線表示 CloudWatch 調查識別出的關係。
-
視覺化內容:此佈局有助於您一目了然地掌握多資源問題的範圍與複雜性。
此視覺化呈現檢視在以下方面特別有用:
-
了解跨多個服務的分散式系統故障
-
識別上游和下游影響關係
-
在深入詳細分析之前,快速評估問題的範圍
注意
當 CloudWatch 調查功能識別出多個資源之間的因果關係時,系統會自動產生假設視覺化圖表。
CloudWatch 調查功能如何尋找資料以提供建議
CloudWatch 調查功能利用各種資料來源,釐清相依關係並規劃分析路徑,包括遙測資料組態、服務組態以及觀測到的關係。如果您使用 CloudWatch Application Signals 和 AWS X-Ray,可以更輕鬆地找到這些相依關係。當 Application Signals 和 X-Ray 不可用時,CloudWatch 調查功能會嘗試透過同時發生的遙測異常來推斷相依項關係。
即使未啟用這些功能,CloudWatch 調查仍會繼續分析遙測資料並提供建議。然而,強烈建議您啟用(建議) 增強調查的最佳實務中列出的服務與功能,以確保 CloudWatch 調查品質與效能最佳。
重要
為協助 CloudWatch 調查提供最相關的資訊,我們可能會使用來自 CloudWatch 調查的特定內容,包括但不限於您向 CloudWatch 調查提出的問題及其回應、洞察、使用者互動、遙測資料和中繼資料,以改善服務。我們將您的信任和隱私以及內容安全性放在首位。如需詳細資訊,請參閱 AWS 服務條款
您可以透過為 CloudWatch 或 AI Operations (aiops) 建立 AI 服務選擇退出政策,選擇不收集您的內容,以開發 CloudWatch 調查或提升調查品質。如需詳細資訊,請參閱《AWS Organizations 使用者指南》中的 AI 服務選擇退出政策。
與 CloudWatch 調查相關的成本
CloudWatch 調查可能產生 AWS 服務使用費用,包括遙測和資源查詢以及其他 API 使用費。雖然其中大部分費用不會計入您的 AWS 帳單,但存在例外情況,包括但不限於:
CloudWatch API (
ListMetrics、GetDashboard、ListDashboards和GetInsightRuleReport)X-Ray API (
GetServiceGraph、GetTraceSummaries和BatchGetTraces)CloudWatch 調查也會使用 AWS Cloud Control API,這可能導致 Amazon Kinesis Data Streams 和 AWS Lambda 等 AWS 服務使用費。
此外,如果您選擇在聊天應用程式中整合 CloudWatch 調查,可能會產生 Amazon Simple Notification Service 使用費。
若這些服務的使用量超過 AWS 免費使用額度,您將在 AWS 帳單中看到相關費用。只要正常使用 CloudWatch 調查,預計這些費用會很低。如需詳細資訊,請參閱 Amazon Kinesis Data Streams 定價