View a markdown version of this page

了解 Amazon Bedrock 成本和用量報告資料 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

了解 Amazon Bedrock 成本和用量報告資料

AWS 資料匯出成本和用量報告 (CUR 2.0) 是接收詳細成本和用量資料 AWS 的建議方式。CUR 2.0 為每個 Amazon Bedrock 推論請求提供明細項目詳細資訊。每個請求都會為每個字符類型產生單獨的明細項目,具有不同的用量類型和單位價格。此頁面說明如何讀取 CUR 中的 Amazon Bedrock 項目,並將其與實際花費保持一致。如需 AWS CUR 2.0 的詳細資訊,請參閱AWS 資料匯出文件

了解 CUR 中的 Amazon Bedrock 定價

CUR 中的 Amazon Bedrock 定價取決於三個因素:字符類型、服務層,以及請求是否透過跨區域推論路由。了解每個項目對於準確的成本對帳至關重要。

字符類型

Amazon Bedrock 費用會細分為四種字符類型。每個 都有不同的單價。

權杖類型 CUR 用量類型模式 說明
輸入字符 *-input-tokens*-mantle-input-tokens-* 在請求提示中傳送的字符
輸出字符 *-output-tokens*-mantle-output-tokens-* 回應中產生的字符
快取讀取字符 *-cache-read-input-token-count 從提示快取讀取的字符 (明顯比輸入便宜)
快取寫入字符 *-cache-write-input-token-count 寫入提示快取的字符 (比輸入更昂貴)
重要

調節要花費的用量時,必須考慮這四種字符類型。如果您只加總輸入和輸出字符,您的總計將與您的帳單不符。這是最常見的調節差距來源,特別是對於大量使用提示快取的工作負載。

服務層

Amazon Bedrock 支援影響定價和可用性的不同服務方案。請求的服務方案會反映在 CUR 用量類型中。對帳成本時,請確保您為每個明細項目相關聯的服務方案套用正確的單價。

如需服務方案及其如何影響推論定價的詳細資訊,請參閱 最佳化效能和成本的服務層

CUR 用量類型範例

line_item_usage_type 欄位識別模型、字符類型、服務層,以及請求是否使用跨區域推論。格式因端點而異:

  • {region}-{model}-{token-type} 適用於bedrock-runtime標準方案請求

  • {region}-{model}-{token-type}-{tier} 用於bedrock-runtime優先順序或彈性方案請求

  • {region}-{model}-mantle-{token-type}-standard 適用於 bedrock-mantle 請求

  • {region}-{model}-{token-type}-cross-region-global 適用於跨區域請求

用量類型 模型 服務層 權杖類型 路由
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard OpenAI gpt-oss-120b 標準 Input 區域內
USE1-gpt-oss-120b-output-tokens-priority OpenAI gpt-oss-120b Priority Output 區域內
USE1-Nova2.0Lite-input-tokens-flex Amazon Nova 2 Lite Flex Input 區域內
USE1-Claude4.6Sonnet-input-tokens Claude Sonnet 4.6 標準 Input 區域內
USE1-Claude4.6Sonnet-cache-read-input-token-count Claude Sonnet 4.6 標準 快取讀取 區域內
USE1-Claude4.6Sonnet-output-tokens-cross-region-global Claude Sonnet 4.6 標準 Output 跨區域

CUR 中的成本分配標籤

來自 IAM 主體專案應用程式推論設定檔的成本分配標籤會顯示為 CUR 中字首為 resourceTags/{key}和 的資料欄iamPrincipal/{key}。例如,索引鍵為 Team的標籤resourceTags/Team

屬性方法 標籤在 CUR 中的顯示方式
IAM 主體標籤 提出請求之 IAM 使用者或角色的標籤
工作階段標籤 角色擔任或聯合期間傳遞的標籤
專案標籤 指派給 Amazon Bedrock 專案的標籤
應用程式推論設定檔標籤 指派給應用程式推論描述檔的標籤

標籤必須啟用為 AWS 帳單主控台中的成本分配標籤,才能出現在 CUR 中。如需詳細資訊,請參閱啟用成本分配標籤

讀取 CUR 資料時需要知道的重要事項

為了充分利用您的 CUR 資料,並避免在分析成本時混淆,請記住下列事項。

  • 所有字符類型的帳戶。Amazon Bedrock 會分別收取輸入、輸出、快取讀取和快取寫入權杖的費用。每個 都有不同的單價。如果您只查看輸入和輸出字符,您的分析將低成本,特別是對於使用大量提示快取的工作負載。

  • 為每個路由類型套用正確的速率。區域內和跨區域推論的單位價格不同。如果您的工作負載同時使用兩者,請確定您在分析成本時對每個工作負載使用相符的速率。

  • 在 CUR 中預期標籤之前啟用標籤。成本分配標籤必須先在 AWS 帳單主控台中啟用,才能出現在 CUR 或 Cost Explorer 中。啟用後,標籤最多需要 24 小時才會開始填入。

  • 針對 IAM 主體屬性使用 CUR 2.0。IAM 主體身分和標籤資料需要 CUR 2.0 (AWS 資料匯出)。如果您使用的是舊版 CUR 格式,則無法使用 IAM 主體欄位。每個金鑰的成本明細都以兩種 CUR 格式提供。如需詳細設定說明,請參閱使用 IAM 主體進行成本分配