在 Amazon Elastic Container Service 中記錄和監控 - Amazon Elastic Container Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Amazon Elastic Container Service 中記錄和監控

監控是維護 Amazon Elastic Container Service 和 AWS 解決方案可靠性、可用性和效能的重要部分。您應該從解決方案的所有部分 AWS 收集監控資料,以便在發生多點故障時更輕鬆地偵錯。 AWS 提供數種工具來監控 Amazon ECS 資源並回應潛在事件:

Amazon CloudWatch 警示

監看指定時段內的單一指標,並根據與多個時段內給定之閾值相對的指標值來執行一或多個動作。此動作是傳送到 Amazon Simple Notification Service (Amazon SNS) 主題或 Amazon EC2 Auto Scaling 政策的通知。CloudWatch 警示不會只因處於特定狀態就調用動作,狀態必須已變更並已維持一段指定的時間。如需詳細資訊,請參閱使用 CloudWatch 監控 Amazon ECS

如果服務的任務使用的是 Fargate,您可以使用 CloudWatch 警示,根據 CloudWatch 指標 (例如 CPU 與記憶體使用率) 來橫向擴充或縮減服務中的任務數量。如需詳細資訊,請參閱自動擴展 Amazon ECS 服務

如果叢集的任務或服務使用的是 EC2,您可以使用 CloudWatch 警示,根據 CloudWatch 指標 (例如叢集記憶體保留量) 來橫向擴充或縮減容器執行個體數量。

Amazon CloudWatch Logs

透過在任務定義中指定 awslogs 日誌驅動程式,可監控、存放及存取 Amazon ECS 任務中容器的日誌檔案。如需詳細資訊,請參閱使用 awslogs 驅動程式

您也可以從 Amazon ECS 容器執行個體監控、存放及存取作業系統和 Amazon ECS 容器代理程式日誌檔案。這種存取日誌的方法可用於使用 EC2 的容器。

Amazon CloudWatch Events

比對事件並將其路由至一或多個目標函數或串流,以進行變更、擷取狀態資訊,以及採取修正動作。如需詳細資訊,請參閱本指南中的使用 EventBridge 自動化因應 Amazon ECS 錯誤,以及 Amazon EventBridge User Guide 中的 EventBridge is the evolution of Amazon CloudWatch Events

AWS CloudTrail 日誌

CloudTrail 提供使用者、角色或 AWS 服務在 Amazon ECS 中採取之動作的記錄。您可以利用 CloudTrail 所收集的資訊來判斷向 Amazon ECS 發出的請求,以及發出請求的 IP 地址、人員、時間和其他詳細資訊。如需詳細資訊,請參閱使用 AWS CloudTrail記錄 Amazon ECS API 呼叫

AWS Trusted Advisor

Trusted Advisor 利用從為數十萬客戶提供服務中學到的 AWS 最佳實務。 會 Trusted Advisor 檢查您的 AWS 環境,然後在有機會節省成本、改善系統可用性和效能,或協助填補安全漏洞時提出建議。所有 AWS 客戶都可以存取五個 Trusted Advisor 檢查。擁有商業或企業支援計劃的客戶可以檢視所有 Trusted Advisor 檢查。

如需詳細資訊,請參閱《支援 使用者指南》中的 AWS Trusted Advisor

AWS Compute Optimizer

AWS Compute Optimizer 是一種 服務,可分析 AWS 資源的組態和使用率指標。這會報告您的資源是否已為最佳化,並產生最佳化建議,以降低成本並改善工作負載的效能。

如需詳細資訊,請參閱AWS Compute Optimizer Amazon ECS 的建議

監控 Amazon ECS 的另一個重要部分是手動監控 CloudWatch 警示未涵蓋的項目。CloudWatch Trusted Advisor和其他 AWS 主控台儀表板可讓您at-a-glance檢視 AWS 環境的狀態。我們建議您也檢查您容器執行個體上的日誌檔,以及您任務中的容器。