本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
了解您的 Amazon Bedrock 成本和使用情况报告数据
AWS 数据导出成本和使用情况报告 (CUR 2.0) 是接收详细成本和使用情况数据的 AWS 推荐方式。CUR 2.0 为每个 Amazon Bedrock 推理请求提供订单项详细信息。每个请求都会为每种代币类型生成单独的行项目,使用类型和单价各不相同。本页介绍如何阅读 CUR 中的 Amazon Bedrock 条目并将其与您的实际支出进行对账。有关 AWS CUR 2.0 的更多信息,请参阅AWS 数据导出文档。
了解 CUR 中的 Amazon Bedrock 定价
CUR 中的 Amazon Bedrock 定价由三个因素决定:令牌类型、服务等级,以及请求是否通过跨区域推理进行路由。了解其中的每一个对于准确的成本对账至关重要。
词元类型
Amazon Bedrock 费用按四种代币类型细分。每个都有不同的单价。
| 令牌类型 | CUR 使用类型模式 | 说明 |
|---|---|---|
| 输入令牌数 | *-input-tokens 或 *-mantle-input-tokens-* |
在请求提示中发送的代币 |
| 输出令牌数 | *-output-tokens 或 *-mantle-output-tokens-* |
响应中生成的代币 |
| 缓存读取令牌 | *-cache-read-input-token-count |
从提示缓存中读取的令牌(比输入便宜得多) |
| 缓存写入令牌 | *-cache-write-input-token-count |
写入提示缓存的令牌(比输入更昂贵) |
重要
在核对使用量与支出时,必须考虑所有四种代币类型。如果您只对输入和输出代币进行求和,则您的总数将与您的账单不符。这是最常见的协调差距来源,特别是对于大量使用提示缓存的工作负载。
服务等级
Amazon Bedrock 支持影响定价和可用性的不同服务等级。请求的服务层反映在 CUR 使用类型中。在核对成本时,请确保为与每个细列项目关联的服务等级应用正确的单价。
有关服务等级及其如何影响推理定价的更多信息,请参阅用于优化性能和成本的服务分层。
CUR 使用类型示例
该line_item_usage_type字段标识模型、令牌类型、服务层以及请求是否使用跨区域推理。格式因端点而异:
-
{region}-{model}-{token-type}用于bedrock-runtime标准等级申请 -
{region}-{model}-{token-type}-{tier}用于bedrock-runtime优先级或弹性等级申请 -
{region}-{model}-mantle-{token-type}-standard用于bedrock-mantle请求 -
{region}-{model}-{token-type}-cross-region-global用于跨区域请求
| 使用情况类型 | 模型 | 服务等级 | 令牌类型 | 路由 |
|---|---|---|---|---|
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard |
OpenAI gpt-oss-120b | 标准 | Input | In-region |
USE1-gpt-oss-120b-output-tokens-priority |
OpenAI gpt-oss-120b | 优先级 | Output | In-region |
USE1-Nova2.0Lite-input-tokens-flex |
亚马逊 Nova 2 Lite | 屈伸 | Input | In-region |
USE1-Claude4.6Sonnet-input-tokens |
克劳德·十四行诗 4.6 | 标准 | Input | In-region |
USE1-Claude4.6Sonnet-cache-read-input-token-count |
克劳德·十四行诗 4.6 | 标准 | 缓存读取 | In-region |
USE1-Claude4.6Sonnet-output-tokens-cross-region-global |
克劳德·十四行诗 4.6 | 标准 | Output | Cross-region |
CUR 中的成本分配标签
来自 IAM 委托人、项目和应用程序推理配置文件的成本分配标签在 CUR 中显示为带有前缀和的列。resourceTags/{key} iamPrincipal/{key}例如,带有密钥的标签Team显示为resourceTags/Team。
| 归因方法 | 标签在 CUR 中的显示方式 |
|---|---|
| IAM 委托人标签 | 来自发出请求的 IAM 用户或角色的标签 |
| 会话标签 | 在担任角色或联合期间传递的标签 |
| 项目标签 | 分配给 Amazon 基岩项目的标签 |
| 应用程序推理配置文件标签 | 分配给应用程序推理配置文件的标签 |
标签必须先在 AWS 账单控制台中激活为成本分配标签,然后才能显示在 CUR 中。有关更多信息,请参阅激活成本分配标签。
读取 CUR 数据时需要知道的关键事项
要充分利用 CUR 数据并避免在分析成本时混淆,请记住以下几点。
-
考虑所有代币类型。Amazon Bedrock 分别对输入、输出、缓存读取和缓存写入令牌收费。每个都有不同的单价。如果你只看输入和输出标记,你的分析就会低估成本,特别是对于大量使用提示缓存的工作负载。
-
对每种路由类型应用正确的费率。 In-region 而跨区域推断的单价不同。如果您的工作负载同时使用两者,请确保在分析成本时使用每种匹配率。
-
在 CUR 中等待标签之前将其激活。成本分配标签必须先在 AWS 账单控制台中激活,然后才能显示在 CUR 或 Cost Explorer 中。激活后,允许最多 24 小时让标签开始填充。
-
使用 CUR 2.0 进行 IAM 本金归因。IAM 委托人身份和标签数据需要 CUR 2.0(AWS 数据导出)。如果您使用的是旧版 CUR 格式,则 IAM 主体字段将不可用。 Per-token 两种CUR格式均提供成本明细。有关详细的设置说明,请参阅使用 IAM 委托人进行成本分配。