View a markdown version of this page

了解您的 Amazon Bedrock 成本和使用情况报告数据 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

了解您的 Amazon Bedrock 成本和使用情况报告数据

AWS 数据导出成本和使用情况报告 (CUR 2.0) 是接收详细成本和使用情况数据的 AWS 推荐方式。CUR 2.0 为每个 Amazon Bedrock 推理请求提供订单项详细信息。每个请求都会为每种代币类型生成单独的行项目,使用类型和单价各不相同。本页介绍如何阅读 CUR 中的 Amazon Bedrock 条目并将其与您的实际支出进行对账。有关 AWS CUR 2.0 的更多信息,请参阅AWS 数据导出文档

了解 CUR 中的 Amazon Bedrock 定价

CUR 中的 Amazon Bedrock 定价由三个因素决定:令牌类型、服务等级,以及请求是否通过跨区域推理进行路由。了解其中的每一个对于准确的成本对账至关重要。

词元类型

Amazon Bedrock 费用按四种代币类型细分。每个都有不同的单价。

令牌类型 CUR 使用类型模式 说明
输入令牌数 *-input-tokens*-mantle-input-tokens-* 在请求提示中发送的代币
输出令牌数 *-output-tokens*-mantle-output-tokens-* 响应中生成的代币
缓存读取令牌 *-cache-read-input-token-count 从提示缓存中读取的令牌(比输入便宜得多)
缓存写入令牌 *-cache-write-input-token-count 写入提示缓存的令牌(比输入更昂贵)
重要

在核对使用量与支出时,必须考虑所有四种代币类型。如果您只对输入和输出代币进行求和,则您的总数将与您的账单不符。这是最常见的协调差距来源,特别是对于大量使用提示缓存的工作负载。

服务等级

Amazon Bedrock 支持影响定价和可用性的不同服务等级。请求的服务层反映在 CUR 使用类型中。在核对成本时,请确保为与每个细列项目关联的服务等级应用正确的单价。

有关服务等级及其如何影响推理定价的更多信息,请参阅用于优化性能和成本的服务分层

CUR 使用类型示例

line_item_usage_type字段标识模型、令牌类型、服务层以及请求是否使用跨区域推理。格式因端点而异:

  • {region}-{model}-{token-type}用于bedrock-runtime标准等级申请

  • {region}-{model}-{token-type}-{tier}用于bedrock-runtime优先级或弹性等级申请

  • {region}-{model}-mantle-{token-type}-standard用于bedrock-mantle请求

  • {region}-{model}-{token-type}-cross-region-global用于跨区域请求

使用情况类型 模型 服务等级 令牌类型 路由
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard OpenAI gpt-oss-120b 标准 Input In-region
USE1-gpt-oss-120b-output-tokens-priority OpenAI gpt-oss-120b 优先级 Output In-region
USE1-Nova2.0Lite-input-tokens-flex 亚马逊 Nova 2 Lite 屈伸 Input In-region
USE1-Claude4.6Sonnet-input-tokens 克劳德·十四行诗 4.6 标准 Input In-region
USE1-Claude4.6Sonnet-cache-read-input-token-count 克劳德·十四行诗 4.6 标准 缓存读取 In-region
USE1-Claude4.6Sonnet-output-tokens-cross-region-global 克劳德·十四行诗 4.6 标准 Output Cross-region

CUR 中的成本分配标签

来自 IAM 委托人项目应用程序推理配置文件的成本分配标签在 CUR 中显示为带有前缀和的列。resourceTags/{key} iamPrincipal/{key}例如,带有密钥的标签Team显示为resourceTags/Team

归因方法 标签在 CUR 中的显示方式
IAM 委托人标签 来自发出请求的 IAM 用户或角色的标签
会话标签 在担任角色或联合期间传递的标签
项目标签 分配给 Amazon 基岩项目的标签
应用程序推理配置文件标签 分配给应用程序推理配置文件的标签

标签必须先在 AWS 账单控制台中激活为成本分配标签,然后才能显示在 CUR 中。有关更多信息,请参阅激活成本分配标签

读取 CUR 数据时需要知道的关键事项

要充分利用 CUR 数据并避免在分析成本时混淆,请记住以下几点。

  • 考虑所有代币类型。Amazon Bedrock 分别对输入、输出、缓存读取和缓存写入令牌收费。每个都有不同的单价。如果你只看输入和输出标记,你的分析就会低估成本,特别是对于大量使用提示缓存的工作负载。

  • 对每种路由类型应用正确的费率。 In-region 而跨区域推断的单价不同。如果您的工作负载同时使用两者,请确保在分析成本时使用每种匹配率。

  • 在 CUR 中等待标签之前将其激活。成本分配标签必须先在 AWS 账单控制台中激活,然后才能显示在 CUR 或 Cost Explorer 中。激活后,允许最多 24 小时让标签开始填充。

  • 使用 CUR 2.0 进行 IAM 本金归因。IAM 委托人身份和标签数据需要 CUR 2.0(AWS 数据导出)。如果您使用的是旧版 CUR 格式,则 IAM 主体字段将不可用。 Per-token 两种CUR格式均提供成本明细。有关详细的设置说明,请参阅使用 IAM 委托人进行成本分配