本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控 Amazon ECS
監控是維護 Amazon ECS 和 AWS 解決方案可靠性、可用性和效能的重要部分。您應該從 AWS 解決方案的所有部分收集監控資料,以便在發生多點失敗時更輕鬆地偵錯。開始監控 Amazon ECS 之前,請建立監控計畫來回答下列問題:
-
監控目標是什麼?
-
要監控哪些資源?
-
監控這些資源的頻率為何?
-
要使用哪些監控工具?
-
誰將執行監控任務?
-
發生問題時應該通知誰?
提供的指標依據叢集中的任務與服務的運算選項而定。如果您使用 Fargate 執行服務,則會提供 CPU 與記憶體使用率指標來協助您監控服務。如果使用的是 Amazon EC2,您擁有且需要監控構成底層基礎結構的 EC2 執行個體。此外,會在叢集、服務和任務層級上提供額外的 CPU 與記憶體保留和使用率指標。
下一步是在各個時間點和不同的負載條件下測量效能,以在您的環境中確立 Amazon ECS 正常效能的基準。當您監控 Amazon ECS 時,請存放歷史記錄監控資料,如此才能與目前的效能資料做比較、辨識正常效能模式和效能異常狀況、規劃問題處理方式。
若要建立基準,您至少必須監控下列項目:
-
您的 Amazon ECS 叢集的 CPU 和記憶體預留及使用率指標
-
您的 Amazon ECS 服務的 CPU 及記憶體使用率指標
如需詳細資訊,請參閱檢視 Amazon ECS 指標。