本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
適用於 CloudWatch 的 Amazon SWF 指標
Amazon SWF 現在提供 CloudWatch 的指標,可用來追蹤工作流程和活動,並針對您選擇的閾值設定警示。您可以使用 檢視指標 AWS Management Console。如需詳細資訊,請參閱使用 檢視 CloudWatch 的 Amazon SWF 指標 AWS Management Console。
Amazon SWF 指標的報告單位
報告時間間隔的指標
CloudWatch 的部分 Amazon SWF 指標是時間間隔,一律以毫秒為單位。CloudWatch 單位報告為 Time。這些指標通常對應至您可以設定工作流程和活動逾時的工作流程執行階段,並且具有類似的名稱。
例如,DecisionTaskStartToCloseTime 指標會測量決策任務開始執行後至完成所耗費的時間,這與您可以為 DecisionTaskStartToCloseTimeout 值設定的期間相同。
如需所有這些工作流程執行階段的圖表,及了解每個階段在工作流程和活動生命週期發生的時間,請參閱「Amazon SWF 逾時類型 」。
報告計數的指標
CloudWatch 報告結果的一些 Amazon SWF 指標以計數表示。例如,WorkflowsCanceled 會將結果記錄為 1 或 0,指出是否取消工作流程。值為 0 並不代表該指標未報告,意思是該指標描述的條件並未發生。
在 CloudWatch Count中報告 的一些 CloudWatch Amazon SWF 指標是每秒計數。例如,在 CloudWatch Count中報告為 ProvisionedRefillRate的 代表每秒請求Count的速率。
對於計數指標,最小值和最大值將一律為零或一,但平均值會是介於零到一的值。
API 和決策事件指標
您可以在 CloudWatch 中同時監控 API 和決策事件,以深入了解您的用量和容量。請參閱 Amazon SWF 中的基本工作流程概念一節中的決策者,以及 Amazon Simple Workflow Service API 參考中的決策主題。
您也可以監控這些限制,以便在接近 Amazon SWF 限流限制時發出警示。如需這些限制和其預設設定的描述,請參閱「Amazon SWF 限流配額」。這些限制旨在預防不正確的工作流程使用過多的系統資源。若要請求提高限制,請參閱「請求提高配額」。
最佳實務是,您應該將 CloudWatch 警示設定為大約 60% 的 API 或決策事件容量。這可讓您在啟用 Amazon SWF 限流之前調整工作流程或請求提高服務限制。根據呼叫的高載性
-
如果您的流量會有遽增情形,請設定在
ProvisionedBucketSize達到 60% 的限制時發出警示。 -
如果您呼叫的速率相當穩定,則請為相關 API 和決策事件設定在
ProvisionedRefillRate達到 60% 的限制時發出警示。
Amazon SWF 指標
下列指標適用於 Amazon SWF:
|
指標 |
描述 |
|---|---|
|
|
決策任務排程後,到由工作者挑選並開始該任務之間的時間間隔 (毫秒)。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
決策任務從開始到其關閉之間的時間間隔 (毫秒)。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已完成的決策作業計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
PendingTasks |
以 1 分鐘為間隔的待處理任務特定任務清單計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已開始但於關閉時已逾時的決策作業計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
工作流程從開始到其關閉之間的時間 (毫秒)。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已取消的工作流程的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已完成的工作流程的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
繼續做為新工作流程的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
失敗工作流程的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已終止之工作流程的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
因任何原因逾時的工作流程計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
活動自排程後到其關閉之間的時間間隔 (毫秒)。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
活動作業建立排程的時間與其開始的時間之間的時間間隔 (毫秒)。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
活動任務從開始到其關閉之間的時間間隔 (毫秒)。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已取消的活動作業的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已完成的活動作業的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
失敗的活動作業的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已排程但於關閉時已逾時的活動作業計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已排程但於開始時已逾時的活動作業計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已開始但於關閉時已逾時的活動作業計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已開始但因為活動訊號逾時而逾時的活動作業計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
已調節之請求的計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
|
|
每秒的可用請求計數。 維度: 有效的統計資訊: |
|
|
每秒的請求計數。 CloudWatch 單位: 維度: 有效的統計資訊: |
ConsumedLimit |
已耗用的一般限制量。 維度: |
|
|
每秒允許進入儲存貯體的請求計數。 維度: 有效的統計資訊: |
ProvisionedLimit |
佈建到帳戶的一般限制數量。 維度: |
|
維度 |
描述 |
|---|---|
|
|
篩選資料至工作流程或活動執行所在的 Amazon SWF 網域。 |
|
|
將資料篩選為活動類型的名稱。 |
|
|
將資料篩選為活動類型的版本。 |
|
|
將資料篩選為此工作流程執行的工作流程類型名稱。 |
|
|
將資料篩選為此工作流程執行的工作流程類型版本。 |
|
|
將資料篩選為指定之 API 名稱的 API。 |
|
|
將資料篩選為所指定的決策名稱。 |
|
將資料篩選為所指定的任務清單名稱。 |
|
|
篩選資料至任務清單的分類。決策任務清單的值為「D」,活動任務清單的值為「A」。 |
|
|
將資料篩選至指定的限流範圍。超過帳戶層級配額時的值為「帳戶」,超過工作流程層級配額時的值為「工作流程」。 |
Amazon SWF 非 ASCII 資源名稱和 CloudWatch 維度
Amazon SWF 允許資源名稱中的非 ASCII 字元,例如 TaskList 和 DomainName。不過,CloudWatch 指標的維度值只能包含可列印的 ASCII 字元。為了確保 Amazon SWF 使用與 CloudWatch 要求相容的維度值,會轉換不符合這些要求的 Amazon SWF 資源名稱,並附加檢查總和,如下所示:
-
任何非 ASCII 字元都會取代為
?。 -
輸入字串或轉換後的字串將視需要截斷。這可確保附加檢查總和時,新的字串長度不會超過 CloudWatch 上限。
-
由於任何非 ASCII 字元都會轉換為
?,因此某些在轉換之前不同的 CloudWatch 指標維度值在轉換後可能看起來相同。為了協助區分它們,原始資源名稱 SHA256 檢查總和的前 16 個字元後面加上底線 (_) 會附加至資源名稱。
轉換範例:
-
test àpple會轉換為test ?pple_82cc5b8e3a771d12 -
àòà會轉換為???_2fec5edbb2c05c22。 -
TaskList 名稱
àpplé和âpplè都會轉換為?ppl?,並且會是相同的。附加檢查總和會傳回不同的值,?ppl?_f39a36df9d85a69d以及?ppl?_da3efb4f11dd0f7f。
提示
您可以產生自己的 SHA256 檢查總和。例如,若要使用shasum命令列工具:
echo -n "<the original resource name>" | shasum -a 256 | cut -c1-16