

# OPS08-BP03 分析工作负载跟踪数据
<a name="ops_workload_observability_analyze_workload_traces"></a>

 分析跟踪数据对于全面了解应用程序的运营过程至关重要。通过以可视化方式呈现和理解各个组件之间的交互，可以微调性能，识别瓶颈，并增强用户体验。 

 **期望的结果：** 清晰地了解应用程序的分布式操作，从而更快地解决问题并增强用户体验。 

 **常见反模式：** 
+  忽略跟踪数据，仅依赖日志和指标。 
+  不将跟踪数据与关联日志联系起来。 
+  忽略从跟踪数据中得出的指标，例如延迟和故障率。 

 **建立此最佳实践的好处：** 
+  改善故障排除并缩短平均解决时间（MTTR）。 
+  深入了解依赖项及其影响。 
+  迅速发现并纠正性能问题。 
+  利用从跟踪数据中得出的指标做出明智的决策。 
+  通过优化组件交互来改善用户体验。 

 **未建立这种最佳实践的情况下暴露的风险等级：** 中 

## 实施指导
<a name="implementation-guidance"></a>

 [AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 提供了一个完整套件来分析跟踪数据，从而提供服务交互的整体视图、监控用户活动并检测性能问题。ServiceLens、X-Ray Insights、X-Ray Analytics 和 Amazon DevOps Guru 等功能，可增强从跟踪数据中获得的可操作见解的深度。 

### 实施步骤
<a name="implementation-steps"></a>

 以下步骤提供了一种结构化方法，可使用 AWS 服务有效地实施跟踪数据分析： 

1.  **集成 AWS X-Ray：** 确保 X-Ray 已与您的应用程序集成，来捕获跟踪数据。 

1.  **分析 X-Ray 指标：** 深入研究从 X-Ray 跟踪数据中得出的指标，例如延迟、请求速率、故障率和响应时间分布，方法是使用 [服务地图](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-servicemap.html#xray-console-servicemap-view) 来监控应用程序运行状况。 

1.  **使用 ServiceLens：** 利用 [ServiceLens 地图](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/servicelens_service_map.html) 来增强您的服务和应用程序的可观测性。这允许以集成方式查看跟踪、指标、日志、警报和其他运行状况信息。 

1.  **启用 X-Ray Insights：** 

   1.  开启 [X-Ray Insights](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) 以自动检测跟踪数据中的异常。 

   1.  研究见解以查明模式并确定根本原因，例如故障率或延迟增加。 

   1.  查阅见解时间表，按时间顺序分析检测到的问题。 

1.  **使用 X-Ray Analytics：** [X-Ray Analytics](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) 可用于全面探究跟踪数据、查明模式和挖掘见解。 

1.  **在 X-Ray 中使用群组：** 在 X-Ray 中创建群组，以根据高延迟等标准筛选跟踪，从而进行更有针对性的分析。 

1.  **纳入 Amazon DevOps Guru：** 利用 [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) 受益于机器学习模型，查明跟踪数据中的操作异常。 

1.  **使用 CloudWatch Synthetics：** 使用 [CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_tracing.html) 来创建用于持续监控您的端点和工作流程的金丝雀。这些金丝雀可以与 X-Ray 集成以提供跟踪数据，用于对正在测试的应用程序进行深入分析。 

1.  **使用真实用户监控（RUM）：** 使用 [AWS X-Ray 和 CloudWatch RUM](https://docs.aws.amazon.com/xray/latest/devguide/xray-services-RUM.html)，您可以通过下游 AWS 托管服务，从应用程序的最终用户开始分析和调试请求路径。这有助于您识别影响用户的延迟趋势和错误。 

1.  **与日志关联：** 将跟踪数据 [与相关日志关联](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/servicelens_troubleshooting.html#servicelens_troubleshooting_Nologs) （在 X-Ray 跟踪视图中），可以详细了解应用程序行为。这允许您查看与跟踪的事务直接关联的日志事件。 

 **实施计划的工作量级别：** 中。 

## 资源
<a name="resources"></a>

 **相关最佳实践：** 
+  [OPS08-BP01 分析工作负载指标](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 分析工作负载日志](ops_workload_observability_analyze_workload_logs.md) 

 **相关文档：** 
+ [ 使用 ServiceLens 监控应用程序运行状况 ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ServiceLens.html)
+ [ 使用 X-Ray Analytics 探究跟踪数据 ](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html)
+ [ 使用 X-Ray Insights 检测跟踪数据中的异常 ](https://docs.aws.amazon.com/xray/latest/devguide/xray-insights.html)
+ [ 使用 CloudWatch Synthetics 进行持续监控 ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html)

 **相关视频：** 
+ [ Analyze and Debug Applications Using Amazon CloudWatch Synthetics and AWS X-Ray](https://www.youtube.com/watch?v=s2WvaV2eDO4)
+ [ Use AWS X-Ray Insights ](https://www.youtube.com/watch?v=tl8OWHl6jxw)

 **相关示例：** 
+ [ One Observability Workshop ](https://catalog.workshops.aws/observability/en-US/intro)
+ [ 使用 X-Ray 实现 AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/services-xray.html)
+ [ CloudWatch Synthetics 金丝雀模板 ](https://github.com/aws-samples/cloudwatch-synthetics-canary-terraform)