本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
根據多時間序列指標洞見查詢建立警示
您可以建立警示,監控整個資源機群的多個時間序列。與針對單一執行個體觸發動作的單一執行個體警示不同,機群監控警示可讓您彙總多個資源的指標,並根據整個機群的條件觸發警示。
使用 設定多時間序列警示 AWS Management Console
此範例示範如何建立一個警示,用於監控整個執行個體機群的記憶體使用率,並在兩個以上的執行個體超過閾值時提醒您。
建立多時間序列警示
透過 https://console.aws.amazon.com/cloudwatch/
開啟 CloudWatch 主控台。 -
在導覽窗格中,選擇 Alarms (警示)、All alarms (所有警示)。
-
選擇 Create alarm (建立警示)。
-
選擇 Select metric (選取指標)。
-
在指標下,輸入 Metrics Insights 查詢:
SELECT MAX(mem_used_percent) FROM "CWAgent" GROUP BY InstanceId ORDER BY MAX() DESC -
選擇下一步。
-
在 Conditions (條件) 下,指定以下內容:
-
對於閾值類型,選擇靜態。
-
對於當指標,選擇大於,然後輸入
80。 -
對於要警示的資料點,輸入
2。
-
-
視需要設定通知和動作。
-
輸入警示的名稱和說明。
-
選擇 Create alarm (建立警示)。
此警示與單一執行個體警示有幾點不同:
-
透過使用指標查詢同時監控多個時間序列。警示每次評估時,都會重新整理指標查詢,因此您的警示會在資源建立、暫停或刪除時自動調整。
-
對於每個違反閾值的貢獻者,警示會傳送貢獻者狀態變更事件,其在 EventBridge 中的事件類型與警示狀態變更事件不同。警示本身的狀態也會變更:一旦至少有一個貢獻者處於警示狀態,警示也會進入警示狀態。
-
然而,某些操作 (例如 SSM 事件) 是在警示層級觸發的。當警示中的貢獻者清單變更時,不會重複此類動作。
此警示與彙總指標查詢警示有幾點不同:
-
其使用
GROUP BY子句個別監控時間序列,而非彙總監控。 -
其遵循您根據需求設定的精細程度:例如,可針對每個 Amazon EC2 執行個體 (Amazon EC2 指標的最高粒度層級) 或每個 Amazon RDS 資料表 (彙總資料表上各種操作的統計值) 觸發警示,視您在
GROUP BY子句中設定的欄位而定 -
其使用
ORDER BY子句排定評估的優先順序。 -
對於每個違反閾值的貢獻者,警示會傳送貢獻者狀態變更事件,其在 EventBridge 中的事件類型與警示狀態變更事件不同。警示本身的狀態也會變更:一旦至少有一個貢獻者處於警示狀態,警示也會進入警示狀態。
-
然而,某些操作 (例如 SSM 事件) 是在警示層級觸發的。當警示中的貢獻者清單變更時,不會重複此類動作。