View a markdown version of this page

在 Amazon EKS 中进行追踪的最佳实践 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon EKS 中进行追踪的最佳实践

本节全面列出了创建有效跟踪系统的最佳实践和技术,该系统可增强在 Amazon EKS 中基于 Kubernetes 的应用程序的可观察性和故障排除。

  • 策略抽样:根据应用程序的流量模式和所用服务的重要性配置不同的采样率。对关键路径实施更高的采样率,同时减少对大批量、不太关键的路径的采样以优化成本。有关指导,请参阅 AWS X-Ray 文档中的配置采样规则

  • 仪器设置:使用自动检测工具(例如 X-Ray SDK 或 AWS Distro for C OpenTelemetry ollectory),以最大限度地减少手动检测工作。保持一致的命名约定和跨服务的上下文传播,以实现更好的跟踪关联。 有关更多信息,请参阅 OpenTelemetry 收藏版文档

  • 数据管理:实施适当的保留期和压缩策略,以平衡存储成本和可观测性需求。建立明确的数据隐私控制和备份程序,以保护敏感的跟踪数据。有关更多信息,请参阅 “日志” 文档中的 “ CloudWatch 日志” 中的更改 CloudWatch 日志数据保留期

  • 性能优化:监控和优化跟踪开销,以最大限度地减少对应用程序性能的影响。使用高效的缓冲和异步处理来减少延迟影响。有关更多信息,请参阅 X-Ray 文档中的配置 AWS X-Ray 守护程序

  • 安全控制:使用 IAM 角色和策略实施适当的访问控制和数据保护措施。定期的安全审计和合规性审查有助于确保追踪数据的安全。有关更多信息,请参阅 X-Ray 文档AWS X-Ray中的安全

  • 监控和警报:设置对跟踪集合运行状况的全面监控,并为收集问题配置警报。跟踪采样率和系统性能指标,以确保最佳运行。有关更多信息,请参阅 CloudWatch 文档中的容器见解

  • 高可用性:跨可用区部署冗余收集器并配置适当的故障转移机制。定期测试高可用性设置可确保可靠的跟踪采集。有关更多信息,请参阅亚马逊 Prometheus 托管服务文档中的使用 AWS 发行版 OpenTelemetry 作为收集器

通过遵循这些最佳实践,您可以为您的 Amazon EKS 环境创建强大、高效且有效的跟踪系统。这将有助于确保基于 Kubernetes 的应用程序具有全面的可观察性、高效的故障排除和最佳性能。