在 DevOpsGuru 中使用洞見 - Amazon DevOps Guru

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 DevOpsGuru 中使用洞見

當 Amazon DevOpsGuru 在營運應用程式中偵測到異常行為時,會產生洞見。DevOpsGuru 會分析您在設定 DevOpsGuru 時所指定 AWS 資源中的指標、事件等。每個洞見都包含一或多個建議,供您採取以減輕問題。它還包含指標清單、日誌群組清單,以及用於識別異常行為的事件清單。

有兩種洞見類型。

  • 被動洞察有您可以採取的建議,以解決目前正在發生的問題。

  • 主動洞察的建議可解決 DevOpsGuru 預測未來將發生的問題。

檢視 DevOpsGuru 洞察

您可以使用 檢視您的洞見 AWS 管理主控台。

檢視您的 DevOpsGuru 洞見
  1. 開啟位於 https://https://console.aws.amazon.com/devops-guru/ 的 Amazon DevOpsGuru 主控台。

  2. 開啟導覽窗格,然後選擇 Insights

  3. 被動索引標籤上,您可以看到被動洞察的清單。在主動標籤上,您可以看到主動洞察的清單。

  4. (選用) 使用下列一或多個篩選條件來尋找您要尋找的洞見。

    • 根據您要尋找的洞見類型,選擇被動主動索引標籤。

    • 選擇篩選條件洞察,然後選擇一個選項來指定篩選條件。您可以新增狀態、嚴重性、資源和標籤篩選條件的組合。使用 AWS 標籤篩選條件,僅檢視具有特定標籤的資源所產生的洞見。如需詳細資訊,請參閱 使用標籤來識別 DevOpsGuru 應用程式中的資源

    注意

    DevOpsGuru 可以分析下列資源,但無法使用標籤篩選其洞見。

    • Amazon API Gateway 路徑和路由

    • Amazon DynamoDB Streams

    • Amazon EC2 Amazon EC2 Auto Scaling 群組執行個體

    • AWS Elastic Beanstalk 環境

    • Amazon Redshift 節點

    • 選擇要依洞見建立時間篩選的時間範圍。

      • 12 小時顯示過去 12 小時內建立的洞見。

      • 1d 顯示過去一天建立的洞見。

      • 1w 顯示過去一週建立的洞見。

      • 1m 顯示上個月建立的洞見。

      • 自訂可讓您指定另一個時間範圍。您可以用來篩選洞見的時間範圍上限為 180 天。

  5. 若要檢視洞見的詳細資訊,請選擇其名稱。

在 DevOpsGuru 主控台中了解洞見

使用 Amazon DevOpsGuru 主控台檢視洞見中的實用資訊,協助您診斷和解決異常行為。當 DevOpsGuru 分析您的資源,並尋找指出異常行為的相關 Amazon CloudWatch 指標、 AWS CloudTrail 事件和操作資料時,它會建立洞見,其中包含解決相關問題的建議,以及有關相關指標和事件的資訊。搭配 使用洞見資料DevOpsGuru 的最佳實務,以解決 DevOpsGuru 偵測到的操作問題。

若要檢視洞見,請依照 中的步驟檢視洞見尋找洞見,然後選擇其名稱。洞見頁面包含下列詳細資訊。

Insight 概觀

使用本節來取得洞見的高階概觀。您可以查看洞見的狀態 (進行中已關閉)、受影響的 CloudFormation 堆疊數量、洞見開始、結束和上次更新的時間,以及如果有的話的相關操作項目。

如果洞見在堆疊層級分組,則您可以選擇受影響的堆疊數量來查看其名稱。建立洞見的異常行為發生在受影響堆疊建立的資源中。如果洞見在帳戶層級分組,則數字為零或不會顯示。

如需詳細資訊,請參閱了解異常行為如何分組為洞見

洞見名稱

洞見的名稱取決於是在堆疊層級帳戶層級進行分組。

  • 堆疊層級洞見名稱包含堆疊的名稱,其中包含具有異常行為的資源。

  • 帳戶層級洞見名稱不包含堆疊名稱。

如需詳細資訊,請參閱了解異常行為如何分組為洞見

彙總指標

選擇彙總指標索引標籤,以檢視與洞見相關的指標。在表格中,每一列代表一個指標。您可以查看哪個 CloudFormation 堆疊建立了發出指標的資源、資源的名稱及其類型。並非所有指標都與 CloudFormation 堆疊相關聯或具有名稱。

當同時有多個資源異常時,時間軸檢視會彙總資源,並在單一時間軸中呈現其異常指標,以便於分析。時間軸上的紅線表示指標發出異常值的時間範圍。若要放大,請使用滑鼠選擇特定的時間範圍。您也可以使用放大鏡圖示來放大和縮小。

在時間軸中選擇紅線以檢視詳細資訊。在開啟的視窗中,您可以:

  • 選擇在 CloudWatch 中檢視,即可在 CloudWatch 主控台中查看指標的外觀。如需詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的統計資料維度

  • 將滑鼠游標暫留在圖表上,以檢視異常指標資料的詳細資訊,以及何時發生。

  • 選擇具有向下箭頭的方塊,以下載圖形的 PNG 影像。

圖形異常

選擇圖形異常索引標籤,以檢視每個洞見的異常的詳細圖形。每個異常都會出現一個圖磚,其中包含相關指標中偵測到的異常行為的詳細資訊。您可以調查並查看資源層級和每個統計資料的異常。圖形會依指標名稱分組。在每個圖磚中,您可以選擇時間軸中要縮放的特定時間範圍。您也可以使用放大和縮小放大鏡圖示,或以小時、天數或週數 (1H3H12H1D3D1W2W) 選擇預先定義的持續時間。

選擇檢視所有統計資料和維度,以查看異常的詳細資訊。在開啟的視窗中,您可以:

  • 選擇在 CloudWatch 中檢視,即可在 CloudWatch 主控台中查看指標的外觀。

  • 將滑鼠游標暫留在圖表上,以檢視異常指標資料的詳細資訊,以及何時發生。

  • 選擇統計資料維度來自訂圖形的顯示。如需詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的統計資料維度

日誌群組

當您啟用日誌異常偵測時,DevOps 會標記您的 CloudWatch 日誌群組,以便您可以檢視與洞見相關的日誌群組。在洞見詳細資訊頁面上的日誌群組區段中,資料表中的每一列代表一個日誌群組並列出相關資源。

當同時有多個異常日誌群組時,時間軸檢視會彙總它們,並以單一時間軸呈現它們,以便於分析。時間軸上的紫色線條表示日誌群組遇到日誌異常的時間範圍。

在時間軸中選擇紫色行,以檢視日誌異常資訊的範例,例如關鍵字例外狀況和數值偏差。選擇檢視日誌群組詳細資訊以檢視日誌異常。在開啟的視窗中,您可以:

  • 檢視日誌異常和相關事件的圖表。

  • 將滑鼠游標暫留在圖表上,以檢視異常日誌資料的詳細資訊,以及日誌資料發生的時間。

  • 詳細檢視日誌異常,其中包含範例訊息、發生頻率、相關建議和發生時間。

  • 按一下 CloudWatch 中的檢視詳細資訊,以檢視日誌異常中的日誌行。

相關事件

相關事件中,檢視與您的洞見相關的 AWS CloudTrail 事件。使用這些事件來協助了解、診斷和解決異常行為的根本原因。

建議

建議中,您可以檢視可能有助於解決基礎問題的建議。當 DevOpsGuru 偵測到異常行為時,它會嘗試建立建議。洞見可能包含一個、多個或零個建議。

了解異常行為如何分組為洞見

洞見會在堆疊層級帳戶層級分組。如果為堆疊中的 AWS CloudFormation 資源產生洞見,則它是堆疊層級洞見。否則,它是帳戶層級洞見。

堆疊的分組方式取決於您在 Amazon DevOpsGuru 中設定資源分析涵蓋範圍的方式。

如果您的涵蓋範圍是由 CloudFormation 堆疊定義

您選擇的堆疊中包含的所有資源都會進行分析,所有偵測到的洞見都會在堆疊層級分組。

如果您的涵蓋範圍是您目前的 AWS 帳戶和區域

分析您帳戶和區域中的所有資源,偵測到的洞見有三種可能的分組案例。

  • 從不屬於堆疊的資源產生的洞見會在帳戶層級分組。

  • 從前 10,000 個已分析堆疊之一的資源產生的洞見會在堆疊層級分組。

  • 從不在前 10,000 個已分析堆疊之一的資源產生的洞見會在帳戶層級分組。例如,針對第 10,001 個分析堆疊中資源產生的洞見會在帳戶層級分組。

如需詳細資訊,請參閱判斷 DevOpsGuru 的涵蓋範圍

了解洞見嚴重性

洞見可以有三種嚴重性之一:。Amazon DevOpsGuru 在偵測到相關異常並為每個異常指派嚴重性後,會建立洞見。DevOpsGuru 使用網域知識和多年的集體經驗,將高嚴重性指派給異常。洞見的嚴重性取決於有助於建立洞見的最嚴重異常。

  • 如果產生洞見的所有異常的嚴重性很,則洞見的嚴重性很

  • 如果產生洞見的所有異常的最高嚴重性為中等,則洞見的嚴重性為中等。產生洞見的一些異常的嚴重性可能很低

  • 如果產生洞見的所有異常的最高嚴重性很高,則洞見的嚴重性很高。產生洞見的一些異常的嚴重性可能是