針對警示變更採取行動
CloudWatch 可以在兩種類型的警示變更時通知使用者:警示變更狀態時,以及更新警示組態時。
當警示評估時,可能會從一種狀態變更為另一種狀態,例如 ALARM 或 OK。對於監控多個時間序列的 Metrics Insights 警示,每個時間序列 (貢獻者) 只能處於 ALARM 或 OK 狀態,絕不可能處於 INSUFFICIENT_DATA 狀態。這是因為時間序列只在資料存在時才存在。
警示動作和通知
下表顯示 Metrics Insights 警示在警示層級與貢獻者層級分別執行的操作:
| 動作類型 | 警示層級 | 貢獻者層級 | 詳細資訊 |
|---|---|---|---|
| SNS 通知 | 是 | 是 | Amazon SNS 事件目標 |
| EC2 動作 (停止、終止、重新啟動、復原) | 否 | 是 | 建立警示以停止、終止、重新啟動或復原 EC2 執行個體 |
| Auto Scaling 動作 | 是 | 否 | Amazon EC2 Auto Scaling 的步進和簡易擴展政策 |
| Systems Manager OpsItem 建立 | 是 | 是 | 設定 CloudWatch 警示以建立 OpsItems |
| Systems Manager Incident Manager 事件 | 是 | 否 | 使用 CloudWatch 警示自動建立事件 |
| Lambda 函式調用 | 是 | 是 | 從警示調用 Lambda 函式 |
| CloudWatch 調查功能調查 | 是 | 否 | 從警示啟動 CloudWatch 調查 |
單一指標警示與多時間序列警示的警示通知內容有所不同:
-
單一指標警示同時包含狀態原因和詳細的狀態原因資料,顯示導致狀態變更的特定資料點。
-
多時間序列警示提供針對每個貢獻者的簡化狀態原因說明,不包含詳細的狀態原因資料區塊。
範例 通知內容範例
單一指標警示通知中包含詳細資料:
{ "stateReason": "Threshold Crossed: 3 out of the last 3 datapoints [32.6 (03/07/25 08:29:00), 33.8 (03/07/25 08:24:00), 41.0 (03/07/25 08:19:00)] were greater than the threshold (31.0)...", "stateReasonData": { "version": "1.0", "queryDate": "2025-07-03T08:34:06.300+0000", "startDate": "2025-07-03T08:19:00.000+0000", "statistic": "Average", "period": 300, "recentDatapoints": [41, 33.8, 32.6], "threshold": 31, "evaluatedDatapoints": [ { "timestamp": "2025-07-03T08:29:00.000+0000", "sampleCount": 5, "value": 32.6 } // Additional datapoints... ] } }
多時間序列警示通知中包含簡化的原因說明:
{ "stateReason": "Threshold Crossed: 3 datapoints were greater than the threshold (0.0). The most recent datapoints which crossed the threshold: [32.6 (03/07/25 08:29:00)]." }
此外,每當警示變更狀態或建立、刪除或更新警示時,CloudWatch 就會傳送事件至 Amazon EventBridge。您可以撰寫 EventBridge 規則,以便在 EventBridge 接收這些事件時採取動作或收到通知。