View a markdown version of this page

在 Amazon EKS 中追蹤的最佳實務 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Amazon EKS 中追蹤的最佳實務

本節提供建立有效追蹤系統的完整最佳實務和技術清單,以增強 Amazon EKS 中以 Kubernetes 為基礎的應用程式的可觀測性和故障診斷。

  • 策略抽樣:根據您應用程式的流量模式和您正在使用之服務的重要性,設定不同的抽樣率。為關鍵路徑實作更高的取樣率,同時減少大量、較不關鍵的路由取樣,以最佳化成本。如需指引,請參閱 AWS X-Ray 文件中的設定抽樣規則

  • 檢測設定:使用 X-Ray SDK 或 AWS Distro for OpenTelemetry 收集器等自動檢測工具,將手動檢測工作降至最低。維持跨 服務的一致命名慣例和內容傳播,以獲得更好的追蹤關聯性。如需詳細資訊,請參閱 Distro for OpenTelemetry 收集器文件

  • 資料管理:實作適當的保留期和壓縮策略,以平衡儲存成本與您的可觀測性需求。建立明確的資料隱私權控制和備份程序,以保護敏感的追蹤資料。如需詳細資訊,請參閱 CloudWatch Logs 文件中的變更 CloudWatch Logs 中的日誌資料保留。 CloudWatch

  • 效能最佳化:監控和最佳化追蹤額外負荷,將對應用程式效能的影響降至最低。使用有效的緩衝和非同步處理,以減少延遲影響。如需詳細資訊,請參閱 X-Ray 文件中的設定 AWS X-Ray 協助程式

  • 安全控制:使用 IAM 角色和政策實作適當的存取控制和資料保護措施。定期安全稽核和合規審查有助於確保追蹤資料保持安全。如需詳細資訊,請參閱 X-Ray 文件中的 安全 AWS X-Ray

  • 監控和提醒:設定追蹤集合運作狀態的全面監控,並設定集合問題的提醒。追蹤取樣率和系統效能指標,以確保最佳操作。如需詳細資訊,請參閱 CloudWatch 文件中的 Container Insights

  • 高可用性:跨可用區域部署備援收集器,並設定適當的容錯移轉機制。定期測試高可用性設定可確保可靠的追蹤收集。如需詳細資訊,請參閱《Amazon Managed Service for Prometheus 文件》中的使用 AWS Distro for OpenTelemetry 做為收集器

透過遵循這些最佳實務,您可以為您的 Amazon EKS 環境建立強大、有效率且有效的追蹤系統。這將有助於確保 Kubernetes 應用程式的完整可觀測性、有效率的故障診斷和最佳效能。