

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Amazon EKS 的監控工具
<a name="monitoring-tools"></a>

本節討論三種 Amazon EKS 監控工具： AWS 監控服務、開放原始碼或專屬解決方案，以及專用工具。

## AWS 服務
<a name="monitoring-services"></a>
+ [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)：全方位監控和記錄服務

  CloudWatch 構成 AWS 監控解決方案的骨幹，並為 Amazon EKS 環境提供廣泛的功能。它為精細容器和叢集指標提供 Container Insights，因此您可以監控效能、資源使用率和應用程式運作狀態。服務在日誌彙總和分析方面表現卓越，並支援跨容器和節點的集中式記錄。CloudWatch 自然與 整合 AWS 服務。它提供自動化警示組態，並支援自訂指標和儀表板，這使得它成為 Amazon EKS 監控的必要工具。
+ [AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html)：進階分散式追蹤平台

  X-Ray 透過提供複雜的分散式追蹤功能來提升可觀測性。其服務地圖視覺化提供應用程式架構和相依性的清晰洞見，詳細的請求追蹤有助於識別跨服務的效能瓶頸。X-Ray 可以透過複雜的微服務架構追蹤請求，這使得它對於疑難排解和最佳化非常寶貴，尤其是在跨越多個 的分散式系統中 AWS 服務。
+ [AWS Distro for OpenTelemetry](https://aws-otel.github.io/)：統一可觀測性架構

  Distro for OpenTelemetry 提供統一的資料收集功能與跨平台支援，因此非常適合混合環境。此服務與其他 整合 AWS 服務，支援自訂檢測，並提供實作全方位監控解決方案的彈性，同時維持與業界標準的相容性。
+ [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html)：企業級視覺化

  Amazon Managed Grafana 為資料視覺化和分析提供全受管服務。它提供與其他 AWS 服務內建安全功能的無縫整合，以及企業級可擴展性。服務可簡化儀表板的建立和管理，同時提供進階功能，例如跨帳戶資料來源存取和與 的整合 AWS IAM Identity Center。
+ [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html)：高可用性、安全、受管監控

  Amazon Managed Service for Prometheus 是一種全受管、與 Prometheus 相容的監控服務。它提供自動化擴展、高可用性和安全指標擷取和查詢。此服務與 Amazon EKS 無縫整合，並消除管理 Prometheus 伺服器的操作開銷。

## 開放原始碼或專屬解決方案
<a name="monitoring-open-source"></a>

上一節所述的 AWS 工具提供無縫整合和受管服務。本節中列出的開放原始碼工具透過提供彈性和廣泛的自訂選項 AWS 服務 來補充 。了解每個工具的功能和使用案例，可協助您設計最符合您特定需求的監控策略。
+ [Prometheus](https://docs.aws.amazon.com/eks/latest/userguide/deploy-prometheus.html)：指標收集工具組

  Prometheus 是在 Kubernetes 環境中收集指標的開放原始碼解決方案。其時間序列資料庫和 PromQL 查詢語言可實現複雜的指標分析。平台的服務探索功能會自動適應動態 Kubernetes 環境，其警示管理系統可讓您隨時掌握重大問題。Prometheus 提供廣泛的整合選項，使其成為全面指標監控的多樣化選擇。
+ [Grafana](https://grafana.com/docs/grafana-cloud/monitor-infrastructure/kubernetes-monitoring/configuration/config-other-methods/config-aws-eks/)：進階視覺化引擎

  Grafana 透過其視覺化功能，將複雜的監控資料轉換為可行的洞見。平台會建立自訂儀表板，結合來自多個來源的資料，並提供基礎設施和應用程式指標的統一檢視。其支援各種資料來源和警示管理功能，可提供全方位的監控。Grafana 可協助您視覺化即時和歷史資料，以便識別趨勢並做出明智的決策。
+ [Fluent Bit](https://fluentbit.io/)：統一記錄層

  此記錄解決方案提供 Kubernetes 環境的日誌收集和管理。其原生 Kubernetes 整合可確保從容器和節點無縫收集日誌，而其對多個輸出目的地的支援可提供日誌儲存和分析的彈性。日誌剖析和篩選等進階功能可讓您根據特定需求處理和路由日誌。Fluent Bit 的輕量性質使其特別適合容器化環境。
+ [Datadog](https://www.datadoghq.com/blog/eks-monitoring-datadog/)：全堆疊可觀測性

  Datadog 提供具有原生 Kubernetes 支援的全方位監控功能。它提供基礎設施監控、應用程式效能監控 (APM)、日誌管理和即時分析。您可以使用平台的自動服務探索和廣泛的整合目錄進行 Amazon EKS 監控，以及其機器學習功能來偵測異常並預測潛在問題。
+ [新複本](https://docs.newrelic.com/docs/infrastructure/amazon-integrations/connect/eks-add-on/)：應用程式效能監控

  New Relic 提供應用程式效能和基礎設施運作狀態的可見性。其 Kubernetes 整合提供詳細的容器洞見、分散式追蹤和自訂儀表板。平台可協助您將應用程式效能與基礎設施指標相互關聯，因此您可以快速識別並解決問題。
+ [Elastic Stack (ELK Stack)](https://aws.amazon.com/opensearch-service/resources/the-benefits-of-the-elk-stack/)：日誌分析和搜尋

  ELK Stack 結合了 Elasticsearch、Logstash 和 Kibana，以提供日誌管理和分析功能。它提供進階搜尋功能、視覺化工具和機器學習功能。您可以使用 堆疊來處理來自 Amazon EKS 環境的大量日誌資料。

## 專用工具
<a name="monitoring-special"></a>

您可以根據您的特定監控需求、操作規模和組織偏好設定，混合和比對下列工具。關鍵是建立監控堆疊，提供全面的可見性，同時保持可管理且符合成本效益。
+ [kube-state-metrics (KSM)](https://github.com/kubernetes/kube-state-metrics)：Kubernetes 狀態監控

  此附加元件服務會接聽 Kubernetes API 伺服器，並產生物件狀態的指標。它提供部署、Pod 和其他 Kubernetes 資源運作狀態的洞見。
+ [Kubernetes 指標伺服器](https://docs.aws.amazon.com/eks/latest/userguide/metrics-server.html)：資源指標

  此指標伺服器會從 kubelet 收集資源指標，並透過 Kubernetes 指標 API 公開它們。它提供水平 Pod 自動擴展和基本 CPU 和記憶體指標。
+ [Kubecost](https://github.com/kubecost/cost-analyzer-helm-chart)：Kubernetes 成本監控

  Kubecost 等工具為 EKS 叢集提供詳細的成本分析和最佳化建議。它們可協助您了解和最佳化不同命名空間、部署和服務之間的雲端支出。