

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 适用于 Amazon EKS 的监控工具
<a name="monitoring-tools"></a>

本节讨论三类 Amazon EKS AWS 监控工具：监控服务、开源或专有解决方案以及专业工具。

## AWS 服务
<a name="monitoring-services"></a>
+ [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)：全面的监控和记录服务

  CloudWatch 构成了 AWS 监控解决方案的支柱，为 Amazon EKS 环境提供了广泛的功能。它为精细的容器和集群指标提供容器见解，因此您可以监控性能、资源利用率和应用程序运行状况。该服务在日志聚合和分析方面表现出色，并支持跨容器和节点的集中日志记录。 CloudWatch 与... 自然融为一体 AWS 服务。它提供自动警报配置，并支持自定义指标和控制面板，这使其成为 Amazon EKS 监控的必备工具。
+ [AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html): 高级分布式追踪平台

  X-Ray 通过提供复杂的分布式跟踪功能来提高可观察性。其服务地图可视化可提供对应用程序架构和依赖关系的清晰见解，详细的请求跟踪有助于识别各服务的性能瓶颈。X-Ray 可以通过复杂的微服务架构跟踪请求，这对于故障排除和优化非常有用，尤其是在跨多个 AWS 服务分布式系统中。
+ [AWS 发行版 OpenTelemetry：统一可](https://aws-otel.github.io/)观测性框架

  Distro for OpenTelemetry 提供统一的数据收集功能和跨平台支持，因此非常适合混合环境。该服务与其他服务集成 AWS 服务，支持定制仪器，在保持与行业标准的兼容性的同时，为实施全面的监控解决方案提供了灵活性。
+ [亚马逊托管 Grafana：企业](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html)级可视化

  Amazon Managed Grafana 为数据可视化和分析提供完全托管的服务。它提供了与其他内置安全功能的无缝集成 AWS 服务，并具有企业级可扩展性。该服务简化了仪表板的创建和管理，同时还提供了高级功能，例如跨账户数据源访问和与 AWS IAM Identity Center集成。
+ [适用于 Prometheus 的亚马逊托管服务](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html)：高度可用、安全、托管的监控

  适用于 Prometheus 的亚马逊托管服务是一项完全托管、与 Prometheus 兼容的监控服务。它提供自动扩展、高可用性以及安全的指标摄取和查询。该服务与 Amazon EKS 无缝集成，消除了管理 Prometheus 服务器的运营开销。

## 开源或专有解决方案
<a name="monitoring-open-source"></a>

上一节中描述的 AWS 工具提供无缝集成和托管服务。本节中列出的开源工具 AWS 服务 通过提供灵活性和广泛的自定义选项来补充。了解每种工具的功能和用例有助于您设计最能满足您特定要求的监控策略。
+ [Prometheus](https://docs.aws.amazon.com/eks/latest/userguide/deploy-prometheus.html)：指标收集工具包

  Prometheus 是一款用于在 Kubernetes 环境中收集指标的开源解决方案。其时间序列数据库和 PromQL 查询语言可实现复杂的指标分析。该平台的服务发现功能可自动适应动态的 Kubernetes 环境，其警报管理系统可让您随时了解关键问题。Prometheus 提供了广泛的集成选项，使其成为全面指标监控的多功能选择。
+ [Grafana](https://grafana.com/docs/grafana-cloud/monitor-infrastructure/kubernetes-monitoring/configuration/config-other-methods/config-aws-eks/)：高级可视化引擎

  Grafana 通过其可视化功能将复杂的监控数据转化为切实可行的见解。该平台可创建自定义仪表板，将来自多个来源的数据组合在一起，并提供基础架构和应用程序指标的统一视图。它支持各种数据源和警报管理功能，可提供全面的监控。Grafana 可以帮助您可视化实时和历史数据，因此您可以识别趋势并做出明智的决策。
+ [Fluent Bit](https://fluentbit.io/)：统一日志层

  该日志解决方案为 Kubernetes 环境提供日志收集和管理。其原生 Kubernetes 集成可确保从容器和节点无缝收集日志，并且它对多个输出目标的支持为日志存储和分析提供了灵活性。日志解析和筛选等高级功能使您能够根据特定要求处理和路由日志。Fluent Bit 的轻量级特性使其特别适合容器化环境。
+ [Datadog](https://www.datadoghq.com/blog/eks-monitoring-datadog/)：全栈可观察性

  Datadog 提供全面的监控功能，并支持原生 Kubernetes。它提供基础设施监控、应用程序性能监控 (APM)、日志管理和实时分析。您可以使用该平台的自动服务发现和广泛的集成目录进行Amazon EKS监控，并使用其机器学习功能来检测异常和预测潜在问题。
+ [全新 Relic](https://docs.newrelic.com/docs/infrastructure/amazon-integrations/connect/eks-add-on/)：应用程序性能监控

  New Relic 提供了对应用程序性能和基础架构运行状况的可见性。它的 Kubernetes 集成提供了详细的容器见解、分布式跟踪和自定义仪表板。该平台可帮助您将应用程序性能与基础架构指标关联起来，以便您可以快速识别和解决问题。
+ El@@ [astic Stack（ELK Stack）](https://aws.amazon.com/opensearch-service/resources/the-benefits-of-the-elk-stack/)：日志分析和搜索

  ELK Stack 结合了 Elasticsearch、Logstash 和 Kibana，提供日志管理和分析功能。它提供高级搜索功能、可视化工具和机器学习功能。您可以使用该堆栈来处理来自您的 Amazon EKS 环境的大量日志数据。

## 专业工具
<a name="monitoring-special"></a>

您可以根据具体的监控要求、运营规模和组织偏好混合搭配以下工具。关键是要创建一个能够提供全面可见性的监控堆栈，同时保持可管理性和成本效益。
+ [kube-state-metrics (KSM)](https://github.com/kubernetes/kube-state-metrics)：Kubernetes 状态监控

  该附加服务监听 Kubernetes API 服务器并生成有关对象状态的指标。它提供了对部署、Pod 和其他 Kubernetes 资源的运行状况的见解。
+ [Kubernetes 指标服务器：资源指标](https://docs.aws.amazon.com/eks/latest/userguide/metrics-server.html)

  该指标服务器从 kubelet 收集资源指标，并通过 Kubernetes 指标 API 将其公开。它提供横向 pod 自动缩放以及基本的 CPU 和内存指标。
+ [Kubecost：Kubernetes 成本](https://github.com/kubecost/cost-analyzer-helm-chart)监控

  诸如 Kubecost 之类的工具可为 EKS 集群提供详细的成本分析和优化建议。它们可以帮助您了解和优化不同命名空间、部署和服务的云支出。