監控 Amazon ECS - Amazon Elastic Container Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控 Amazon ECS

監控是維護 Amazon ECS 和 AWS 解決方案可靠性、可用性和效能的重要部分。您應該從 AWS 解決方案的所有部分收集監控資料,以便在發生多點失敗時更輕鬆地偵錯。開始監控 Amazon ECS 之前,請建立監控計畫,其中包含下列問題的答案:

  • 監控目標是什麼?

  • 要監控哪些資源?

  • 監控這些資源的頻率為何?

  • 要使用哪些監控工具?

  • 誰將執行監控任務?

  • 發生問題時應該通知誰?

提供的指標依據叢集中的任務與服務的啟動類型而定。如果您的服務使用的是 Fargate 啟動類型,將提供 CPU 與記憶體使用率指標,以協助您監控服務。對於 Amazon EC2 啟動類型,您擁有且需要監控構成基礎設施的 EC2 執行個體。叢集、服務和任務提供其他 CPU 和記憶體保留和使用率指標。

下一步是在各個時間點和不同的負載條件下測量效能,以在您的環境中確立 Amazon ECS 正常效能的基準。當您監控 Amazon ECS 時,請存放歷史記錄監控資料,如此才能與目前的效能資料做比較、辨識正常效能模式和效能異常狀況、規劃問題處理方式。

若要建立基準,您至少必須監控下列項目:

  • 您的 Amazon ECS 叢集的 CPU 和記憶體預留及使用率指標

  • 您的 Amazon ECS 服務的 CPU 及記憶體使用率指標

    如需詳細資訊,請參閱檢視 Amazon ECS 指標