什麼是 Amazon CloudWatch? - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

什麼是 Amazon CloudWatch?

Amazon CloudWatch 可即時監控您的 Amazon Web Services (AWS) 資源以及您在 AWS 上執行的應用程式,提供多種工具,讓您能夠在整個系統範圍內監控應用程式的效能、運作狀態及資源使用情況。

透過指標、警示和儀表板實現操作可見性

指標會依使用者定義的間隔收集和追蹤關鍵效能資料。許多 AWS 服務會自動向 CloudWatch 報告指標,您也可以從應用程式在 CloudWatch 中發佈自訂指標

儀表板提供資源與應用程式的統一檢視,在同一個位置視覺化呈現您的指標和日誌。也可以跨帳戶和區域共用儀表板,以提升運作意識。CloudWatch 為許多 AWS 服務提供精選的自動儀表板,因此您不需要自行建置。

可以設定警示,對照使用者定義的閾值持續監控 CloudWatch 指標。他們可以自動傳送有關違反閾值的警示,還能透過觸發自動化動作來自動回應資源行為的變化。

應用程式效能監控 (APM)

透過 Application Signals,您可以自動偵測和監控應用程式的關鍵效能指標 (例如延遲、錯誤率和請求率),而無需手動檢測或變更程式碼。Application Signals 同時提供精心設計的儀表板,讓您只需極少的設定即可開始監控。

CloudWatch Synthetics 可讓您透過名為 Canary 的可設定指令碼主動監控端點和 API,以模擬使用者行為,並在可用性問題或效能降低影響真實使用者之前提醒您,從而完善此功能。您也可以使用 CloudWatch RUM 從實際使用者工作階段收集效能資料。

在 CloudWatch 中使用服務水準目標 (SLO) 來定義、追蹤應用程式的特定可靠性目標,並發出相關警示,透過設定錯誤預算並持續監控服務水準目標 (SLO) 的合規性,協助您維持服務品質承諾。

基礎設施監控

許多 AWS 服務會自動免費將基本指標傳送至 CloudWatch。傳送指標的服務列於此處。此外,CloudWatch 為數個 AWS 基礎設施的關鍵部分提供額外的監控功能:

  • Database Insights 可讓您即時監控資料庫效能指標、分析 SQL 查詢效能,以及針對 AWS 資料庫服務排解資料庫載入問題。

  • Lambda Insights 提供有關 Lambda 函式的系統層級指標,包括記憶體和 CPU 使用率追蹤,以及冷啟動偵測和分析。

  • Container Insights 讓您能夠收集並分析來自容器化應用程式的指標,適用於 Amazon ECS 叢集、Amazon EKS 叢集,以及部署於 Amazon EC2 上的自我管理式 Kubernetes 叢集。

收集、儲存和查詢日誌

CloudWatch Logs 提供一套強大的功能,用於進行全面的日誌管理和分析。從 AWS 服務和自訂應用程式擷取的日誌會存放在日誌群組和串流中,以便輕鬆組織。CloudWatch Logs Insights 可用於對您的日誌資料執行互動式快速查詢,提供三種查詢語言選擇,包括 SQL 與 PPL。日誌極端值偵測功能可用於尋找日誌群組中日誌事件的異常模式,這可能表示存在問題。建立指標篩選條件,從日誌擷取數值並產生 CloudWatch 指標,可用於發出警示和儀表板。設定訂閱篩選條件以即時處理和分析日誌,或將其路由到 Amazon S3、Firehose 等其他服務。

使用 CloudWatch 代理程式可從 Amazon EC2 機群收集指標、日誌和追蹤

使用 CloudWatch 代理程式可從 Amazon EC2 執行個體和內部部署伺服器機群收集有關程序、CPU、記憶體、磁碟用量和網路效能的詳細系統指標。也可以從應用程式收集和監控自訂指標、從多個來源彙總日誌,並依據收集的資料設定警示。亦可使用代理程式來收集 GPU 指標。代理程式支援 Windows 和 Linux 作業系統,並可整合 Systems Manager 以進行集中式組態管理。

跨帳戶監控

藉助 CloudWatch 跨帳戶可觀測性,您可以設定中央監控帳戶,以監控跨多個帳戶的應用程式並進行疑難排解。從中央帳戶,您可以檢視組織內各來源帳戶的指標、日誌與追蹤。這種集中式方法可讓您建立跨帳戶儀表板、設定從多個帳戶監看指標的警示,以及跨帳戶界限執行根本原因分析。透過 CloudWatch 跨帳戶可觀測性,您可以個別連結來源帳戶或透過 AWS Organizations自動連結。

解決方案目錄

CloudWatch 提供可立即使用的組態目錄,協助您快速實作各種 AWS 服務和常見工作負載的監控,例如 Java 虛擬機器 (JVM)NVIDIA GPUApache KafkaApache TomcatNGINX。這些解決方案提供有針對性的指引,包括安裝和設定 CloudWatch 代理程式、部署預先定義之自訂儀表板以及設定相關警示的說明。

網路和網際網路監控

CloudWatch 透過 CloudWatch 網路監控提供全面的網路和網際網路監控功能。

網路監視器使用 AWS 全域網路資料來分析應用程式與最終使用者之間的網際網路效能和可用性。透過 Internet Monitor,您可以識別或接收通知,以掌握影響客戶的延遲增加或區域性中斷狀況。Internet Monitor 的運作方式是分析您的 VPC 流量日誌,從而提供有關網路流量模式和效能的自動化洞見。您還可以取得有關如何為用戶端最佳化應用程式效能的建議。

Network Flow Monitor 會顯示由您安裝在執行個體上的輕量級軟體代理程式收集到的網路效能資訊。藉助流量監視器,您可以在指定的時間範圍內,快速視覺化呈現網路連線的封包遺失和延遲狀況。每個監視器也會產生網路運作狀態指標 (NHI),告訴您監視器在評估期間追蹤的網路流程是否有 AWS 網路問題。

使用 連線時 Direct Connect,您可以在 Network Synthetic Monitor 中使用合成監視器,透過在 VPC 和內部部署端點之間執行合成測試來主動監控網路連線。當您建立合成監視器時,您可以提供 VPC 子網路和內部部署 IP 地址來指定探查。 會在背景中 AWS 建立和管理基礎設施,以使用探查執行往返時間和封包遺失測量所需的基礎設施。該等測試能夠在連線、DNS 和延遲問題影響到應用程式之前,及早偵測到這些問題,以便您可以採取行動來提升終端使用者的體驗。

帳單與成本

如需 CloudWatch 定價的完整資訊,請參閱 Amazon CloudWatch 定價

如需可協助您分析帳單及可能最佳化和降低成本的資訊,請參閱 分析、最佳化和降低 CloudWatch 成本

Amazon CloudWatch 資源

以下相關資源可協助您使用此服務。

資源 Description

Amazon CloudWatch 常見問答集

此「常見問答集」涵蓋開發人員針對此產品最常詢問的問題。

AWS 開發人員中心

尋找文件、程式碼範例、版本備註和其他資訊的中心起點,以協助您使用 建置創新應用程式 AWS。

AWS 管理主控台

主控台可讓您執行 Amazon CloudWatch 和其他各種 AWS 方案的大部分功能,無需程式設計。

Amazon CloudWatch 開發論壇

社群形式的論壇,供開發人員討論 Amazon CloudWatch 相關技術問題。

AWS 支援

建立和管理 AWS 支援 案例的中樞。也包含其他實用資源的連結,例如論壇、技術FAQs、服務運作狀態和 AWS Trusted Advisor。

Amazon CloudWatch 產品資訊

提供 Amazon CloudWatch 資訊的主要網頁。

聯絡我們

詢問有關 AWS 帳單、帳戶、事件、濫用等問題的中央聯絡窗口。