

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用指标监控`基底运行时推断` CloudWatch
<a name="monitoring-runtime-metrics"></a>

Amazon Bedrock `bedrock-runtime.{{region}}.amazonaws.com` 终端节点在`AWS/Bedrock`命名空间 CloudWatch 下向亚马逊发布指标。使用这些指标来监控调用量、延迟、令牌消耗、错误率和模型调用日志传输。

如果您的应用程序通过调用推理`bedrock-mantle.{{region}}.api.aws`，请参阅[使用指标监控`基岩地幔推断` CloudWatch](monitoring-mantle-metrics.md)。

## Amazon Bedrock 运行时指标
<a name="runtime-cloudwatch-metrics"></a>

下表描述了 Amazon Bedrock 提供的运行时指标。


| 指标名称 | 单位 | 说明 | 
| --- | --- | --- | 
| Invocations | SampleCount | 成功请求[匡威](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html)、[ConverseStream[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)、和 [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API 操作的次数。 | 
| InvocationLatency | MilliSeconds | 从发送请求到收到最后一个令牌的时间。<br />要区分由服务端吞吐量变化引起的延迟增加和模型响应时间较长导致的延迟增加，请参阅[使用每秒输出令牌 (OTPS) 进行诊断`InvocationLatency`增加](monitoring-runtime-otps.md)。 | 
| InvocationClientErrors | SampleCount | 导致发生客户端错误的调用次数。 | 
| InvocationServerErrors | SampleCount | 导致 AWS 服务器端错误的调用次数。 | 
| InvocationThrottles | SampleCount | 系统节流的调用次数。受限请求和其他调用错误不会计入调用次数或错误次数。实际显示的节流次数取决于 SDK 中的重试设置。有关更多信息，请参阅 AWS SDK 和工具参考指南中的[重试行为](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html)。 | 
| InputTokenCount | SampleCount | 输入中的令牌数。 | 
| LegacyModelInvocations | SampleCount | 使用[旧版](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_FoundationModelLifecycle.html)模型的调用次数  | 
| OutputTokenCount | SampleCount | 输出中的令牌数。 | 
| OutputImageCount | SampleCount | 输出中的图像数（仅适用于图像生成模型）。 | 
| TimeToFirstToken | MilliSeconds | 从发送请求到收到第一个令牌的时间，用于[ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)和[InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)流式传输 API 操作。 | 
| EstimatedTPMQuotaUsage | SampleCount | C [onverse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html)、、[ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)和 [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)API 操作的每分钟代币 (TPM) 配额消耗量估计。[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)该指标是一个近似值，并不反映推动限制决策的基于预留的代币消耗。限制基于输入令牌的预留额加上`max_tokens`（参见[Amazon Bedrock 中词元的计算方式](quotas-token-burndown.md)），这可能与此估计值有所不同。请勿将此指标用作配额使用量或容量规划的唯一指标。 | 
| CacheReadInputTokens | SampleCount | 从[提示缓存](prompt-caching.md)中读取的输入令牌的数量。这些代币按较低的费率收费，不计入您的TPM配额。 | 
| CacheWriteInputTokens | SampleCount | 写入[提示缓存](prompt-caching.md)的输入令牌的数量。这些代币计入您的 TPM 配额。 | 

还提供了针对 [Amazon Bedrock 护栏](monitoring-guardrails-cw-metrics.md)和 [Amazon Bedrock 代理](monitoring-agents-cw-metrics.md)的指标。

## 模型调用日志指标 CloudWatch
<a name="br-cloudwatch-metrics"></a>

对于每次成功或失败的配送尝试，都会在命名空间`AWS/Bedrock`和`Across all model IDs`维度下发出以下 Amazon CloudWatch 指标：
+ `ModelInvocationLogsCloudWatchDeliverySuccess`
+ `ModelInvocationLogsCloudWatchDeliveryFailure`
+ `ModelInvocationLogsS3DeliverySuccess`
+ `ModelInvocationLogsS3DeliveryFailure`
+ `ModelInvocationLargeDataS3DeliverySuccess`
+ `ModelInvocationLargeDataS3DeliveryFailure`

要检索 Amazon Bedrock 操作的指标，请指定以下信息：
+ 指标维度。*维度*是用于标识指标的一组名称-值对。Amazon Bedrock 支持以下维度：
  + `ModelId` – 所有指标
  + `ModelId + ImageSize + BucketedStepSize` – OutputImageCount
+ 指标名称，如 `InvocationClientErrors`。

您可以通过 AWS 管理控制台、或 CloudWatch API 获取 Amazon Bedrock 的指标。 AWS CLI您可以通过其中一个 AWS 软件开发套件 (SDK) 或 CloudWatch API 工具来使用 API。 CloudWatch 

要在 CloudWatch 控制台中查看 Amazon Bedrock 指标，请前往导航窗格的指标部分并选择所有指标选项，然后搜索型号 ID。

您必须拥有相应的 CloudWatch 权限才能监控 Amazon Bedrock。 CloudWatch 有关更多信息，请参阅亚马逊* CloudWatch 用户指南 CloudWatch*中的[亚马逊身份验证和访问控制](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/auth-and-access-control-cw.html)。