使用 Application Signals 监控应用程序的运行状况
使用 CloudWatch 控制台
-
监控您的应用程序服务:作为日常运行监控的一部分,使用服务页面查看完整服务摘要。查看故障率最高或延迟时间最长、服务级别指标(SLI)运行不正常的服务。选择一项服务即可打开服务详细信息页面,查看详细指标、服务运营、Synthetics Canary、和客户端请求。这一操作可以帮助您进行问题排查并确定运行问题的根本原因。
-
检查应用程序拓扑结构 – 借助应用程序图,可长期了解并监控应用程序的拓扑结构,包括客户端、Synthetics 金丝雀、各类服务及依赖关系之间的关联关系。即时查看服务级别指标(SLI)运行状况以及调用量、故障率和延迟等关键指标。在服务详细信息页面深入查看更多详细信息。
探索示例场景,该场景演示如何使用这些页面快速排查运营服务运行状况问题,覆盖初始检测到确定根本原因的全过程。
Application Signals 如何实现运行状况监控
为应用程序启用 Application Signals 功能后,应用程序的各项服务、API 及其依赖关系会被自动发现,并在服务、服务详情和应用程序图页面中展示。Application Signals 从多个来源收集信息,进而实现服务发现和运行状况监控:
-
AWS Distro for OpenTelemetry(ADOT):作为启用 Application Signals 的其中一步,将 OpenTelemetry Java 和 Python 自动检测库配置为发出 CloudWatch 代理收集的指标和跟踪。这些指标和跟踪用于发现服务、操作、依赖项和其他服务信息。
-
服务级别目标(SLO)– 为各服务创建服务级别目标后,“服务”、“服务详情”和“应用程序图”页面将同步展示服务级别指标(SLI)的运行状况。SLI 可以监控延迟、可用性和其他运行指标。
-
CloudWatch Synthetics Canary:当您为 Canary 配置 X-Ray 跟踪时,Canary 脚本的服务调用将与您的服务关联并显示在服务详细信息页面。
-
CloudWatch 真实用户监控(RUM):在您的 CloudWatch RUM Web 客户端上启用 X-Ray 跟踪后,服务请求会自动关联并显示在“服务详细信息”页面。
-
AWS Service Catalog AppRegistry:Application Signals 会自动发现您账户中的 AWS 资源,并允许您将其归为 AppRegistry 中创建的逻辑应用程序。“服务”页面显示的应用程序名称基于运行服务的相关计算资源。
注意
Application Signals 根据所选当前时间筛选器中发出的指标和跟踪显示您的服务和操作。(默认为过去三个小时。) 如果用于服务、运营、依赖项、Synthetics Canary 或客户端页面的当前时间筛选器内并无活动,则不予显示。
最多可以显示 1000 项服务。服务和服务拓扑的发现最多可能会延迟 10 分钟。对服务级别指标(SLI)运行状况的评估最多可能延迟 15 分钟。
注意
Application Signals 控制台目前仅支持在 30 天时间范围内最多选择一天。