在 AMS Accelerate 中加入 Amazon EKS 的監控和事件管理 - AMS Accelerate 使用者指南

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 AMS Accelerate 中加入 Amazon EKS 的監控和事件管理

執行下列步驟以加入 Amazon EKS 的監控和事件管理。

  1. 啟用 Amazon EKS 成本最佳化標籤:請參閱《Amazon EKS 使用者指南》中的標記您的資源以進行計費

  2. 開始加入 EKS 的監控和事件管理:請聯絡您的 Cloud Service Delivery Manager (CSDM),其中包含要加入的帳戶 IDs和叢集名稱。

  3. 驗證需求:您的雲端架構師 (CA) 會在加入開始之前驗證是否符合所有需求

  4. 更新 Kubernetes 角色型存取控制 (RBAC):AMS 會共用eksctl命令以實作這些變更。您可以檢閱這些變更,然後部署。您必須部署 RBAC 更新,讓 AMS 具有代表您執行命令的許可。這些更新包括將 AMS IAM 角色映射至 Kubernetes 使用者、為 AMS 建立新的 Kubernetes 叢集角色,以及將 AMS Kubernetes 叢集角色繫結至使用者。

  5. 部署叢集元件:AMS 會在叢集上的 AMS 受管命名空間中部署下列元件:

    • Prometheus 伺服器

    • Prometheus 節點匯出工具 (不適用於 AWS Fargate)

    • kube-state-metrics

  6. 執行 Prometheus 組態更新:AMS 設定 Prometheus 為指標啟用遠端寫入。

  7. (選用) 設定儀表板:您的 CA 可協助您在帳戶中設定 Amazon Managed Grafana 儀表板。

注意

加入 Amazon EKS 叢集之後,AMS 會分析警示訊號並執行基準評估,以識別叢集中現有的問題。基準評估完成後,AMS 會透過 Trusted Advisor 分享問題清單和修復建議,以及可用來解決叢集問題的服務請求。從評估中,AMS 會調整我們的帳戶層級警示閾值,以建立 EKS 叢集專屬的 Amazon EKS 監控基準。為了消除這些調查結果的重複 AMS 回應,我們調整監控以排除這些警示訊號。我們會重新調整監控,以在 CSDM 通知我們基礎問題已修復時包含訊號。