本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控效能
Amazon Quick Automate 提供全方位的監控功能,可協助您追蹤自動化的效能、稽核和疑難排解。本節說明如何在 Amazon Quick Automate 中使用效能監控功能。
先決條件
在使用效能儀表板之前,您需要:
作用中自動化 - 必須執行至少一個自動化才能查看指標
自動化群組存取 - 檢視您要監控之自動化群組的許可
自動化摘要儀表板
自動化索引標籤提供自動化產品組合的高階指標和關鍵效能指標。
自動化摘要圖表
儀表板包含三個主要效能視覺化:
自動化分佈 - 顯示依自動化群組整理的部署自動化數量,協助您了解整個組織的自動化足跡
成功率 - 顯示成功完成的案例與遇到例外狀況的案例的百分比,讓您深入了解自動化可靠性
節省時間 - 根據成功完成案例計算節省的總時數,再乘以為每個自動化專案設定的預估節省時間
自動化詳細資訊表
每個自動化都會列出關鍵指標和狀態資訊:
自動化名稱 - 部署自動化的名稱和版本
最新執行 - 最近的執行狀態和時間戳記
案例指標 - 已處理的案例計數,細分方式:
成功完成的案例
具有業務例外狀況的案例
具有系統例外狀況的案例
任務 - 自動化建立human-in-the-loop任務數量
執行儀表板
Runs 索引標籤提供個別自動化執行及其結果的詳細可見性。
執行狀態
自動化可以處於下列其中一個執行狀態:
等待 - 自動化已排入佇列,並等待可用的系統資源開始執行。這通常是短暫的轉換狀態。
進行中 - 自動化正在主動執行其設定的步驟。您可以透過日誌監控即時進度。
已完成 - 自動化已成功完成所有步驟。
失敗 - 自動化遇到無法從 復原並停止執行的錯誤。詳細的錯誤資訊可在 日誌中找到。
已停止 - 使用者使用結束或終止動作手動中斷自動化執行。
注意
未完成的執行計數包括等待中和進行中。
執行詳細資訊資料表
每次執行都會透過下列資料欄提供完整的執行資訊:
狀態 - 目前執行狀態 (如執行狀態類型所定義)
自動化 - 正在執行的自動化名稱
版本 - 執行之自動化的特定版本編號
開始時間 - 自動化執行開始時
結束時間 - 自動化完成或停止的時間
持續時間 - 自動化的總執行時間
案例指標 - 已處理的案例計數,細分方式:
成功完成的案例
具有業務例外狀況的案例
具有系統例外狀況的案例
任務 - 在執行中建立human-in-the-loop任務數量
注意
資料會在第一次導覽至頁面時重新整理。按一下重新整理按鈕,隨時提取最新的資料。
案例儀表板
Cases 索引標籤可追蹤個別案例記錄的整個生命週期。
案例圖表
儀表板包含兩個主要效能視覺化:
建立的案例總數 - 顯示一段時間內建立的案例數量,協助您了解自動化磁碟區。
最佳例外狀況 - 顯示前 5 個例外狀況原因和每個例外狀況的相對計數,協助您排定最佳化工作的優先順序,以改善成功率。
案例狀態
案例可以處於以下其中一個處理狀態:
就緒 - 案例已建立,並正在等待接收以進行處理。這是所有新案例的初始狀態。
進行中 - 自動化正在主動處理案例。您可以透過日誌監控即時進度。
待解決 - 案例正在等待human-in-the-loop任務完成,才能繼續處理。任務解決後,案例會回到就緒狀態。
成功 - 案例已完成,沒有任何例外狀況。
失敗 - 案例遇到下列其中一個例外狀況類型:
業務例外狀況 - 案例發生處理的業務規則違規並停止處理。詳細的例外狀況資訊可在 日誌中找到。
系統例外狀況 - 案例發生技術錯誤並停止處理。詳細的錯誤資訊可在 日誌中找到。
如需案例處理和協同運作模式的詳細資訊,請參閱協同運作動作。
搜尋和篩選
效能儀表板包含所有監控檢視中可用的搜尋和篩選功能,可協助您尋找特定資訊。篩選依據:
時間範圍
狀態
自動化群組
自動化
注意
您也可以根據參考名稱或例外狀況原因在案例頁面上搜尋。
環境選擇
在檢視指標之間切換:
測試 - 來自開發環境中自動化測試的資料
部署 - 來自部署自動化的資料
注意
您選取的環境會套用至所有儀表板索引標籤,直到變更為止。
CloudWatch
Amazon CloudWatch 為 Amazon Quick Automate 中的自動化提供監控和可觀測功能。本節說明 CloudWatch 中可用的指標、如何檢視指標,以及如何設定這些指標的警示。
先決條件
IAM 角色和許可
若要依照最低權限原則授予 CloudWatch 存取權:
建立 IAM 角色或群組,最好使用 AWS IAM Identity Center。
連接 AWS 受管政策 CloudWatchFullAccess 以取得完整的監控和警示功能。
或者,新增 CloudWatchLogsReadOnlyAccess 以進行日誌查詢,無需刪除許可。
將使用者指派給此角色或群組,以在沒有更廣泛管理存取權的情況下啟用 CloudWatch 操作。
如需step-by-step說明,請參閱 CloudWatch 和 CloudWatch 許可指南中的設定。 CloudWatch
存取 CloudWatch
導覽至 AWS 管理主控台。
在服務搜尋列中輸入 CloudWatch。
從結果中選擇 CloudWatch,以開啟 CloudWatch 主控台。
存取 Amazon Quick Automate 的 CloudWatch 指標
開啟 CloudWatch 主控台。
在左側導覽窗格中,選擇指標、所有指標。
選擇服務命名空間 QuickSight。
選擇相關的維度 AutomationGroupId 或 AutomationId,以檢視指標。
使用搜尋列依指標名稱或維度進行搜尋或篩選。
如需詳細資訊,請參閱 CloudWatch 指標文件。
可用的指標
Amazon Quick Automate 會將指標發佈至 QuickSight 命名空間下的 CloudWatch。指標會依 AutomationId 或 AutomationGroupId 維度分組。
注意
CloudWatch 是一項區域服務。若要檢視指標,請確定您位於自動化執行所在的相同 AWS 區域。
AutomationId 指標
這些指標會追蹤個別自動化效能:
FailedAutomationRunCount - 在執行期間失敗的自動化執行總數。使用此指標來識別需要注意或偵錯的問題自動化。
SuccessfulAutomationRunCount - 成功完成的自動化執行總數。使用此指標來追蹤自動化可靠性和成功率。
AutomationRunDuration - 每次自動化執行完成所需的時間。使用此指標來識別效能瓶頸並最佳化自動化效率。
StoppedAutomationRunCount - 在完成之前手動停止或終止的自動化執行次數。這可能表示使用者介入或系統啟動的停止。
TotalAutomationRunCount - 無論狀態為何,所有自動化執行的彙總計數。使用此指標來監控整體自動化活動和用量模式。
AutomationGroupId 指標
這些指標可在所有案例中提供更廣泛的檢視:
TotalCaseCount - 自動化系統處理的案例總數。使用此指標來追蹤整體工作負載量。
CompletedCaseCount - 已成功處理和完成的案例數量。使用此指標測量輸送量和生產力。
FailedCaseCount - 處理期間失敗的案例數量。使用此指標來識別失敗中的系統問題或模式。
CaseDuration - 從開始到完成處理案例所需的時間。使用此指標來評估整體系統效能,並識別最佳化的機會。
尋找 AutomationId 和 AutomationGroupId
若要尋找自動化的 AutomationId 和 AutomationGroupId:
登入 Amazon Quick Automate。
在左側導覽窗格中,選擇自動化。
選擇包含自動化的自動化群組。
選擇自動化名稱以開啟自動化。
選擇 Deployment (部署) 索引標籤。
選擇動作 (⋮) 和檢視部署詳細資訊,以取得部署詳細資訊標題下方的頂部自動化 ID 和群組 ID。
設定 CloudWatch 警示
使用這些指標來監控自動化的運作狀態,或在 CloudWatch 中設定警示。例如,您可以為下列條件建立警示:
超過五個自動化執行會在指定的期間內失敗。
超過 10 個案例會在指定的期間內失敗。
案例持續時間超過 30 分鐘。
如需建立警示的詳細資訊,請參閱 CloudWatch 警示。