模型调用

CloudWatch 生成式人工智能可观测性功能便于您监控模型调用性能。您可以使用开箱即用的视图来追踪调用次数、令牌使用量和错误率等指标。要深入分析输入和输出等调用内容，请启用 Bedrock 调用日志记录功能，将日志发送到 CloudWatch。有关更多信息，请参阅 Set up a CloudWatch Logs destination 和 Help protect sensitive log data with masking。

在 Amazon Bedrock 中启用模型调用

注意

必须在 Amazon Bedrock 中启用模型调用日志记录功能才能查看调用数据。

按照以下步骤操作，在 Amazon Bedrock 中启用模型调用日志记录功能。

通过以下网址打开 Amazon Bedrock 控制台：https://console.aws.amazon.com/bedrock/。
选择设置。
在模型调用日志记录下，勾选模型调用日志记录选项。
选择需要包含在日志中的数据类型。如果已向 Amazon S3 推送日志，可选择仅将日志发送到 CloudWatch Logs，或同时发送到 Amazon S3 和 CloudWatch Logs。
在 CloudWatch Logs 配置中，创建日志组名称并选择适当的服务角色。
选择需要包含在日志中的数据类型。
选择保存设置

只要开始使用 Amazon Bedrock 调用服务，系统会自动显示预配置的控制面板。启用 Model Invocation logging 后，即可查看默认控制面板及下方关联的调用记录表。

调用次数：Converse、ConverseStream、InvokeModel 和 InvokeModelWithResponseStream API 操作的成功请求数量
调用延迟：调用操作的延迟时间
按模型统计的令牌数：按输入令牌数和输出令牌数划分的模型令牌统计数
按模型 ID 统计的日令牌数：按模型 ID 统计的每日令牌总数
输入令牌数、输出令牌数：相应账户所选模型中输入和输出的令牌总数
按输入令牌分组的请求数：按 6 个区间分组的请求数量。每条线代表落入特定区间的请求数
调用节流数：系统节流的调用次数。实际显示的节流次数取决于 SDK 中的重试设置。有关更多信息，请参阅《AWS SDKs and Tools Reference Guide》中的 Retry behavior
调用错误次数：服务端和客户端错误导致的调用失败次数统计

按照以下步骤操作，使用模型调用控制面板。

将鼠标悬停在任意指标图表上方，可查看调用详情。点击警报图标设置 Alarms，可监控应用程序的质量和性能。
在 ModelID 下拉列表中选择一个模型 ID，可查看对应指标。
选择在 CloudWatch 指标中查看，可在 CloudWatch 中查看控制面板指标。
选择时段覆盖，可调整指标的统计时段（例如：1 分钟、1 小时或 6 小时）。
在调用下选择请求 ID，可查看请求的详情。在右侧窗格中可查看模型调用输入和输出详情。

在请求 ID 页面的操作下拉列表中，选择在 Logs Insights 中查看，即可在 CloudWatch Logs 中查看日志。有关更多信息，请参阅使用 CloudWatch Logs Insights 分析日志数据。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

生成式人工智能可观测性

Amazon Bedrock AgentCore