View a markdown version of this page

監控效能 - Amazon Quick

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控效能

Amazon Quick Automate 提供全方位的監控功能,可協助您追蹤自動化的效能、稽核和疑難排解。本節說明如何在 Amazon Quick Automate 中使用效能監控功能。

先決條件

在使用效能儀表板之前,您需要:

  • 作用中自動化 - 必須執行至少一個自動化才能查看指標

  • 自動化群組存取 - 檢視您要監控之自動化群組的許可

自動化摘要儀表板

自動化索引標籤提供自動化產品組合的高階指標和關鍵效能指標。

自動化摘要圖表

儀表板包含三個主要效能視覺化:

  • 自動化分佈 - 顯示依自動化群組整理的部署自動化數量,協助您了解整個組織的自動化足跡

  • 成功率 - 顯示成功完成的案例與遇到例外狀況的案例的百分比,讓您深入了解自動化可靠性

  • 節省時間 - 根據成功完成案例計算節省的總時數,再乘以為每個自動化專案設定的預估節省時間

自動化詳細資訊表

每個自動化都會列出關鍵指標和狀態資訊:

  • 自動化名稱 - 部署自動化的名稱和版本

  • 最新執行 - 最近的執行狀態和時間戳記

  • 案例指標 - 已處理的案例計數,細分方式:

    • 成功完成的案例

    • 具有業務例外狀況的案例

    • 具有系統例外狀況的案例

  • 任務 - 自動化建立human-in-the-loop任務數量

執行儀表板

Runs 索引標籤提供個別自動化執行及其結果的詳細可見性。

執行狀態

自動化可以處於下列其中一個執行狀態:

  • 等待 - 自動化已排入佇列,並等待可用的系統資源開始執行。這通常是短暫的轉換狀態。

  • 進行中 - 自動化正在主動執行其設定的步驟。您可以透過日誌監控即時進度。

  • 已完成 - 自動化已成功完成所有步驟。

  • 失敗 - 自動化遇到無法從 復原並停止執行的錯誤。詳細的錯誤資訊可在 日誌中找到。

  • 已停止 - 使用者使用結束或終止動作手動中斷自動化執行。

注意

未完成的執行計數包括等待中和進行中。

執行詳細資訊資料表

每次執行都會透過下列資料欄提供完整的執行資訊:

  • 狀態 - 目前執行狀態 (如執行狀態類型所定義)

  • 自動化 - 正在執行的自動化名稱

  • 版本 - 執行之自動化的特定版本編號

  • 開始時間 - 自動化執行開始時

  • 結束時間 - 自動化完成或停止的時間

  • 持續時間 - 自動化的總執行時間

  • 案例指標 - 已處理的案例計數,細分方式:

    • 成功完成的案例

    • 具有業務例外狀況的案例

    • 具有系統例外狀況的案例

  • 任務 - 在執行中建立human-in-the-loop任務數量

注意

資料會在第一次導覽至頁面時重新整理。按一下重新整理按鈕,隨時提取最新的資料。

案例儀表板

Cases 索引標籤可追蹤個別案例記錄的整個生命週期。

案例圖表

儀表板包含兩個主要效能視覺化:

  • 建立的案例總數 - 顯示一段時間內建立的案例數量,協助您了解自動化磁碟區。

  • 最佳例外狀況 - 顯示前 5 個例外狀況原因和每個例外狀況的相對計數,協助您排定最佳化工作的優先順序,以改善成功率。

案例狀態

案例可以處於以下其中一個處理狀態:

  • 就緒 - 案例已建立,並正在等待接收以進行處理。這是所有新案例的初始狀態。

  • 進行中 - 自動化正在主動處理案例。您可以透過日誌監控即時進度。

  • 待解決 - 案例正在等待human-in-the-loop任務完成,才能繼續處理。任務解決後,案例會回到就緒狀態。

  • 成功 - 案例已完成,沒有任何例外狀況。

  • 失敗 - 案例遇到下列其中一個例外狀況類型:

    • 業務例外狀況 - 案例發生處理的業務規則違規並停止處理。詳細的例外狀況資訊可在 日誌中找到。

    • 系統例外狀況 - 案例發生技術錯誤並停止處理。詳細的錯誤資訊可在 日誌中找到。

如需案例處理和協同運作模式的詳細資訊,請參閱協同運作動作

搜尋和篩選

效能儀表板包含所有監控檢視中可用的搜尋和篩選功能,可協助您尋找特定資訊。篩選依據:

  • 時間範圍

  • 狀態

  • 自動化群組

  •  自動化

注意

您也可以根據參考名稱或例外狀況原因在案例頁面上搜尋。

環境選擇

在檢視指標之間切換:

  • 測試 - 來自開發環境中自動化測試的資料

  • 部署 - 來自部署自動化的資料

注意

您選取的環境會套用至所有儀表板索引標籤,直到變更為止。

CloudWatch

Amazon CloudWatch 為 Amazon Quick Automate 中的自動化提供監控和可觀測功能。本節說明 CloudWatch 中可用的指標、如何檢視指標,以及如何設定這些指標的警示。

先決條件

IAM 角色和許可

若要依照最低權限原則授予 CloudWatch 存取權:

  • 建立 IAM 角色或群組,最好使用 AWS IAM Identity Center。

  • 連接 AWS 受管政策 CloudWatchFullAccess 以取得完整的監控和警示功能。

  • 或者,新增 CloudWatchLogsReadOnlyAccess 以進行日誌查詢,無需刪除許可。

  • 將使用者指派給此角色或群組,以在沒有更廣泛管理存取權的情況下啟用 CloudWatch 操作。

如需step-by-step說明,請參閱 CloudWatch 和 CloudWatch 許可指南中的設定CloudWatch

存取 CloudWatch

  • 導覽至 AWS 管理主控台。

  • 在服務搜尋列中輸入 CloudWatch。

  • 從結果中選擇 CloudWatch,以開啟 CloudWatch 主控台。

存取 Amazon Quick Automate 的 CloudWatch 指標

  • 開啟 CloudWatch 主控台。

  • 在左側導覽窗格中,選擇指標所有指標

  • 選擇服務命名空間 QuickSight

  • 選擇相關的維度 AutomationGroupIdAutomationId,以檢視指標。

  • 使用搜尋列依指標名稱或維度進行搜尋或篩選。

如需詳細資訊,請參閱 CloudWatch 指標文件

可用的指標

Amazon Quick Automate 會將指標發佈至 QuickSight 命名空間下的 CloudWatch。指標會依 AutomationIdAutomationGroupId 維度分組。

注意

CloudWatch 是一項區域服務。若要檢視指標,請確定您位於自動化執行所在的相同 AWS 區域。

AutomationId 指標

這些指標會追蹤個別自動化效能:

  • FailedAutomationRunCount - 在執行期間失敗的自動化執行總數。使用此指標來識別需要注意或偵錯的問題自動化。

  • SuccessfulAutomationRunCount - 成功完成的自動化執行總數。使用此指標來追蹤自動化可靠性和成功率。

  • AutomationRunDuration - 每次自動化執行完成所需的時間。使用此指標來識別效能瓶頸並最佳化自動化效率。

  • StoppedAutomationRunCount - 在完成之前手動停止或終止的自動化執行次數。這可能表示使用者介入或系統啟動的停止。

  • TotalAutomationRunCount - 無論狀態為何,所有自動化執行的彙總計數。使用此指標來監控整體自動化活動和用量模式。

AutomationGroupId 指標

這些指標可在所有案例中提供更廣泛的檢視:

  • TotalCaseCount - 自動化系統處理的案例總數。使用此指標來追蹤整體工作負載量。

  • CompletedCaseCount - 已成功處理和完成的案例數量。使用此指標測量輸送量和生產力。

  • FailedCaseCount - 處理期間失敗的案例數量。使用此指標來識別失敗中的系統問題或模式。

  • CaseDuration - 從開始到完成處理案例所需的時間。使用此指標來評估整體系統效能,並識別最佳化的機會。

尋找 AutomationId 和 AutomationGroupId

若要尋找自動化的 AutomationId 和 AutomationGroupId:

  • 登入 Amazon Quick Automate。

  • 在左側導覽窗格中,選擇自動化

  • 選擇包含自動化的自動化群組。

  • 選擇自動化名稱以開啟自動化。

  • 選擇 Deployment (部署) 索引標籤。

  • 選擇動作 (⋮)檢視部署詳細資訊,以取得部署詳細資訊標題下方的頂部自動化 ID群組 ID

設定 CloudWatch 警示

使用這些指標來監控自動化的運作狀態,或在 CloudWatch 中設定警示。例如,您可以為下列條件建立警示:

  • 超過五個自動化執行會在指定的期間內失敗。

  • 超過 10 個案例會在指定的期間內失敗。

  • 案例持續時間超過 30 分鐘。

如需建立警示的詳細資訊,請參閱 CloudWatch 警示