代理视图 - Amazon CloudWatch

代理视图

代理视图为账户代理提供了精心设计的控制面板。您可以查看托管在 AWS 原生服务(例如:AgentCore Runtime、Lambda 或 Amazon EC2)上的代理数据。该视图还会显示向 CloudWatch 发送遥测数据的代理。

概述

指标和控制面板会显示源自采样代理跨度的数据。有关代理跨度的信息,请参阅 Spans

支持以下代理指标:

  • 代理/别名数:已完成埋点且生成跨度的代理与别名总量

  • 会话数:由已埋点且生成跨度的代理所创建的会话总量。会话类似于对话,包含完整的上下文信息

  • 追踪数:由已埋点且生成跨度的代理所创建的追踪总量。每次追踪代表会话中的一个独立请求-响应周期

  • 错误率:代理交互过程中出现错误的百分比

  • 节流率:代理交互中被限制的百分比

选择查看详情,以图表形式查看代理指标。

代理视图

运行时指标

Runtime 指标和控制面板会显示 Runtime 基础组件中的数据。通过该基础组件,您可以在 Amazon Bedrock AgentCore 运行时环境中托管代理。有关更多信息,请参阅 Creating an AgentCore Runtime

AgentCore Runtime 支持以下指标

  • 运行时代理/别名数:追踪托管在 AgentCore Runtime 上的代理和别名数量

  • 运行时会话数:追踪在 AgentCore Runtime 中运行的代理创建的会话数量。会话类似于对话,包含整个交互流程的完整上下文。该指标可用于监控平台整体使用情况、容量规划及用户参与模式分析

  • 运行时调用数:向数据面板 API 发出的请求总数。无论请求有效载荷或响应状态如何,每个 API 调用都计为一次调用

  • 运行时错误数:系统错误及用户错误数量。有关系统错误及用户错误的定义,请参阅 AgentCore provided runtime metrics

  • 运行时节流数:因超出允许的 TPS(每秒事务数)而受服务节流的请求数量。这些请求会返回 throttlingException,HTTP 状态码为 429。监控该指标有助于判断是否需要调整服务配额或优化请求模式

在默认控制面板中查看指标随时间的变化趋势。展开查看详情即可显示指标图表。

运行时视图

座席

代理是指从应用程序采集并发送监控数据的组件。代理列表会显示账户中配置的所有代理。这些代理可以托管在 AWS 原生服务(例如:AgentCore Runtime、Lambda 或 Amazon EC2)上。该列表还会展示其他已埋点并向 CloudWatch 发送遥测数据的代理。

您可以使用筛选代理,查找要深入解析的特定代理;也可以使用列名对代理排序,快速定位所需代理。点击齿轮图标可显示或隐藏附加列。

运行时代理视图

点击代理名称前的展开图标,可查看该代理的详情。

运行时代理概览

代理详情 – 概览

“概览”选项卡会显示代理指标的自动控制面板。这些指标来自采样跨度和运行时指标(如果代理使用 AgentCore Runtime)。

代理指标控制面板包含基于采样跨度生成的指标:

  • 会话和追踪数:该代理的会话和追踪总量

  • FM 令牌使用量:基础模型令牌总消耗量。可按特定基础模型筛选图表数据

  • 系统及客户端错误数:请求处理期间的系统错误总量。较高的服务端错误率可能表明存在需排查的基础设施问题或服务问题。客户端错误是指无效请求导致的错误。较高的服务端错误率可能表明请求格式或权限存在问题

  • 按跨度统计的错误率和延迟:按特定跨度统计的错误率及延迟。请注意,一个跨度可能出现在多个代理中

  • 节流数:因超出允许的 TPS(每秒事务数)而受服务节流的请求数量

运行时指标控制面板包含 AgentCore Runtime 自动生成的指标:

  • 运行时会话及调用数:统计该代理在 Runtime 托管期间生成的会话及调用总量

  • 运行时延迟:托管在 Runtime 上的代理发出的请求延迟

  • 运行时节流数:因超出允许的 TPS(每秒事务数)而受服务节流的请求数量

代理详情 – 会话

单个代理可包含多个会话。在会话选项卡中查看会话。使用筛选会话或对列进行排序,可查找目标会话。

选择会话 ID,可查看会话摘要指标以及属于该会话的追踪列表。会话指标包括:

  • 追踪数:属于会话的追踪数量

  • 服务器错误数:请求处理期间的系统错误数量。较高的服务端错误率可能表明存在需排查的基础设施问题或服务问题

  • 客户端错误数:客户端错误是指无效请求导致的错误。较高的服务端错误率可能表明请求格式或权限存在问题

  • 节流数:该会话中因超出允许的 TPS(每秒事务数)而受节流的请求数量

  • 会话详情:有关会话的元数据,例如开始时间、结束时间和会话 ID

要分析会话中的追踪记录列表,请选择筛选追踪缩小范围或者对表列进行排序,突出显示想要调查的特定追踪记录。

选择追踪记录后,右侧窗格会显示该追踪的详情。每条追踪记录均显示以下内容:追踪摘要、跨度及追踪内容详情。

追踪摘要中会显示以下指标:

注意

摘要页面字段在代理视图会话视图追踪视图都是一致的。

  • 跨度数:单条追踪记录内包含跨度数量

  • 服务器错误数:请求处理期间的系统错误数量。较高的服务端错误率可能表明存在需排查的基础设施问题或服务问题

  • 客户端错误数:客户端错误是指无效请求导致的错误。较高的服务端错误率可能表明请求格式或权限存在问题

  • 节流数:该会话中因超出允许的 TPS(每秒事务数)而受节流的请求数量

  • P95 跨度延迟:该特定跨度所有调用中 95% 请求的延迟时间上限值。请注意,一个跨度可以在多个代理中使用

  • 追踪详情:有关追踪的元数据,例如开始时间、结束时间和追踪 ID

跨度视图

选择时间范围既可查看每个跨度的持续时间,又可了解耗时最长且导致响应缓慢的跨度。

轨迹视图

选择轨迹功能可分析跨度间的关联关系及其后续调用链。

跨度中选择单个跨度事件,查看原始格式的跨度数据。查看原始格式的跨度数据。如需进行精细化故障排查,选择事件选项卡核查模型输入与输出。

代理详情 – 追踪记录

单个代理可能包含多条追踪记录。在追踪选项卡中查看追踪详情。选择筛选追踪或对列进行排序,可查找目标追踪记录。