本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
警示評估
指標警示狀態
警示擁有以下可能的狀態:
-
OK– 指標或表達式在定義的閾值內。 -
ALARM– 指標或表達式在定義的閾值外。 -
INSUFFICIENT_DATA– 警示剛開始無法使用指標,或資料不足無法讓指標判斷警示狀態。
警示評估狀態
除了警示狀態之外,每個警示都有一個評估狀態,可提供警示評估程序的相關資訊。可能會發生下列狀態:
-
PARTIAL_DATA– 表示由於配額限制,並非所有可用的資料都能夠擷取。如需詳細資訊,請參閱如何處理部分資料。 -
EVALUATION_ERROR– 指出警示設定中需要檢閱和更正的組態錯誤。如需詳細資訊,請參閱警示的 StateReason 欄位。 -
EVALUATION_FAILURE– 表示暫時 CloudWatch 問題。我們建議手動監控,直到問題解決為止
您可以在 主控台的警示詳細資訊中,或使用 CLI describe-alarms 命令或 DescribeAlarms API 來檢視評估狀態。
警示評估設定
當您建立警示時,必須指定三種設定讓 CloudWatch 評估何時變更警示狀態:
-
期間是為了建立警示的每個資料點,用來評估指標或表達式的時間長度。它會以秒表示。
-
Evaluation Periods (評估期間) 是判斷警示狀態時所評估的最近期間數或資料點數目。
-
Datapoints to Alarm (要警示的資料點) 是在評估期間,必須違規以導致警示進入
ALARM狀態的資料點數目。違規的資料點不必連續,但是其必須位於等於 Evaluation Period (評估期間) 的資料點最後數字的範圍內。
對於任何一分鐘或更長的期間,系統會每分鐘評估一次警示,且此評估是以期間和評估期間所定義的時間範圍為依據。舉例來說,如果期間為 5 分鐘 (300 秒) 且評估期間的數量為 1,則在第 5 分鐘結束時,警示將會根據第 1 到第 5 分鐘的資料進行評估。接著,在第 6 分鐘結束時,系統會根據第 2 到第 6 分鐘的資料評估警示。
如果警示期間為 10 秒、20 秒或 30 秒,則系統會每 10 秒評估警示一次。如需詳細資訊,請參閱高解析度警示。
如果警示的評估期間數目乘以每個評估期間的長度超過一天,系統會每小時評估一次。如需如何評估這些多日警示的詳細資訊,請參閱 評估多日警示的範例。
下圖中,指標警示的警示閾值已設為三個單位。Evaluation Period (評估期間) 和 Datapoints to Alarm (要警示的資料點) 均為 3。也就是說,當最新三個連續期間中的所有現有資料點都超過閾值時,警示便會移至 ALARM 狀態。在此圖中,這會在第三到五個時段發生。在期間六,值 dips 低於閾值,因此評估其中一個期間不違反,且警示狀態變更為 OK。在第九個時段,再次達到閾值,但只針對一個期間。因此,該警示狀態會維持 OK。
當您將 Evaluation Periods (評估期間) 和 Datapoints to Alarm (要警示的資料點) 設為不同值時,您會設定「N 個項目中有 M 個」警示。警示的資料點為 ("M"),而評估期間為 ("N")。評估間隔是評估期間的數量乘以期間長度。例如,若您設定 1 分鐘內 5 個資料點中有 4 個,則評估間隔為 5 分鐘。若您設定 10 分鐘內 3 個資料點中有 3 個,則評估間隔為 30 分鐘。
注意
如果在建立警示後資料點很快便遺失,並在建立警示之前向 CloudWatch 報告指標,則 CloudWatch 在評估警示時會擷取建立警示前的最新資料點。
高解析度警示
如果您在高解析度指標上設定警示,您可以指定期間為 10 秒、20 秒或 30 秒的高解析度警示。高解析度警示費用更高。如需高解析度指標的詳細資訊,請參閱 發布自訂指標。
評估多日警示的範例
如果評估期間數目乘以每個評估期間的長度超過一天,警示即為多日警示。系統每小時評估多日警示一次。評估多日警示時,CloudWatch 僅會考量目前小時 :00 分鐘之前的指標。
舉例來說,假設有個警示用來監控每三天於 10:00 執行的任務。
-
10:02,任務失敗
-
10:03,警示評估並保持
OK狀態,因為評估僅考慮截至 10:00 的資料。 -
11:03,警示考慮截至 11:00 的資料並進入
ALARM狀態。 -
11:43,您更正錯誤,任務成功執行。
-
12:03,警示再次評估、確認任務成功執行,並回復至
OK狀態。