在 AMS Accelerate 中加入 Amazon EKS 的监控和事件管理 - AMS 加速用户指南

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 AMS Accelerate 中加入 Amazon EKS 的监控和事件管理

执行以下步骤以加入 Amazon EKS 的监控和事件管理。

  1. 启用 Amazon EKS 成本优化标签:请参阅 Amazon EKS 用户指南中的标记资源以进行计费

  2. 启动 EKS 的监控和事件管理入门:请联系您的云服务交付经理 (CSDM),提供要加入的账户 IDs 和集群名称。

  3. 验证要求:您的云架构师 (CA) 将在入职开始之前验证是否满足了所有要求

  4. 更新 Kubernetes 基于角色的访问控制 (RBAC):AMS 共享命令来实现这些eksctl更改。您可以查看这些更改,然后进行部署。您必须部署 RBAC 更新,这样 AMS 才有权代表您运行命令。这些更新包括将 AMS IAM 角色映射到 Kubernetes 用户、为 AMS 创建新的 Kubernetes 集群角色以及将 AMS Kubernetes 集群角色绑定到该用户。

  5. 部署集群组件:AMS 在您的集群上的 AMS 管理的命名空间中部署以下组件:

    • Prometheus 服务器

    • Prometheus 节点导出器(不适用于) AWS Fargate

    • kube-state-metrics

  6. 执行 Prometheus 配置更新:AMS 将 Prometheu s 配置为启用指标的远程写入。

  7. (可选)配置控制面板:您的 CA 可帮助您在账户中配置 Amazon Managed Grafana 控制面板。

注意

在您的 Amazon EKS 集群加载后,AMS 会分析警报信号并执行基准评估以确定集群中存在的问题。基准评估完成后,AMS 将通过 Trusted Advisor 分享调查结果和补救建议,并提交一份服务请求,您可以使用这些请求来解决集群中的问题。根据评估,AMS 通过调整账户级别的警报阈值,创建特定于您的 EKS 集群的 Amazon EKS 监控基准。为了消除针对这些发现的重复AMS响应,我们调整了监控以排除这些警报信号。当您的CSDM通知我们潜在问题已得到修复时,我们会重新调整监控,以包括信号。