本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
了解 Amazon Bedrock 成本和用量報告資料
AWS 資料匯出成本和用量報告 (CUR 2.0) 是接收詳細成本和用量資料 AWS 的建議方式。CUR 2.0 為每個 Amazon Bedrock 推論請求提供明細項目詳細資訊。每個請求都會為每個字符類型產生單獨的明細項目,具有不同的用量類型和單位價格。此頁面說明如何讀取 CUR 中的 Amazon Bedrock 項目,並將其與實際花費保持一致。如需 AWS CUR 2.0 的詳細資訊,請參閱AWS 資料匯出文件。
了解 CUR 中的 Amazon Bedrock 定價
CUR 中的 Amazon Bedrock 定價取決於三個因素:字符類型、服務層,以及請求是否透過跨區域推論路由。了解每個項目對於準確的成本對帳至關重要。
字符類型
Amazon Bedrock 費用會細分為四種字符類型。每個 都有不同的單價。
| 權杖類型 | CUR 用量類型模式 | 說明 |
|---|---|---|
| 輸入字符 | *-input-tokens 或 *-mantle-input-tokens-* |
在請求提示中傳送的字符 |
| 輸出字符 | *-output-tokens 或 *-mantle-output-tokens-* |
回應中產生的字符 |
| 快取讀取字符 | *-cache-read-input-token-count |
從提示快取讀取的字符 (明顯比輸入便宜) |
| 快取寫入字符 | *-cache-write-input-token-count |
寫入提示快取的字符 (比輸入更昂貴) |
重要
調節要花費的用量時,必須考慮這四種字符類型。如果您只加總輸入和輸出字符,您的總計將與您的帳單不符。這是最常見的調節差距來源,特別是對於大量使用提示快取的工作負載。
服務層
Amazon Bedrock 支援影響定價和可用性的不同服務方案。請求的服務方案會反映在 CUR 用量類型中。對帳成本時,請確保您為每個明細項目相關聯的服務方案套用正確的單價。
如需服務方案及其如何影響推論定價的詳細資訊,請參閱 最佳化效能和成本的服務層。
CUR 用量類型範例
line_item_usage_type 欄位識別模型、字符類型、服務層,以及請求是否使用跨區域推論。格式因端點而異:
-
{region}-{model}-{token-type}適用於bedrock-runtime標準方案請求 -
{region}-{model}-{token-type}-{tier}用於bedrock-runtime優先順序或彈性方案請求 -
{region}-{model}-mantle-{token-type}-standard適用於bedrock-mantle請求 -
{region}-{model}-{token-type}-cross-region-global適用於跨區域請求
| 用量類型 | 模型 | 服務層 | 權杖類型 | 路由 |
|---|---|---|---|---|
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard |
OpenAI gpt-oss-120b | 標準 | Input | 區域內 |
USE1-gpt-oss-120b-output-tokens-priority |
OpenAI gpt-oss-120b | Priority | Output | 區域內 |
USE1-Nova2.0Lite-input-tokens-flex |
Amazon Nova 2 Lite | Flex | Input | 區域內 |
USE1-Claude4.6Sonnet-input-tokens |
Claude Sonnet 4.6 | 標準 | Input | 區域內 |
USE1-Claude4.6Sonnet-cache-read-input-token-count |
Claude Sonnet 4.6 | 標準 | 快取讀取 | 區域內 |
USE1-Claude4.6Sonnet-output-tokens-cross-region-global |
Claude Sonnet 4.6 | 標準 | Output | 跨區域 |
CUR 中的成本分配標籤
來自 IAM 主體、專案和應用程式推論設定檔的成本分配標籤會顯示為 CUR 中字首為 resourceTags/{key}和 的資料欄iamPrincipal/{key}。例如,索引鍵為 Team的標籤resourceTags/Team。
| 屬性方法 | 標籤在 CUR 中的顯示方式 |
|---|---|
| IAM 主體標籤 | 提出請求之 IAM 使用者或角色的標籤 |
| 工作階段標籤 | 角色擔任或聯合期間傳遞的標籤 |
| 專案標籤 | 指派給 Amazon Bedrock 專案的標籤 |
| 應用程式推論設定檔標籤 | 指派給應用程式推論描述檔的標籤 |
標籤必須啟用為 AWS 帳單主控台中的成本分配標籤,才能出現在 CUR 中。如需詳細資訊,請參閱啟用成本分配標籤。
讀取 CUR 資料時需要知道的重要事項
為了充分利用您的 CUR 資料,並避免在分析成本時混淆,請記住下列事項。
-
所有字符類型的帳戶。Amazon Bedrock 會分別收取輸入、輸出、快取讀取和快取寫入權杖的費用。每個 都有不同的單價。如果您只查看輸入和輸出字符,您的分析將低成本,特別是對於使用大量提示快取的工作負載。
-
為每個路由類型套用正確的速率。區域內和跨區域推論的單位價格不同。如果您的工作負載同時使用兩者,請確定您在分析成本時對每個工作負載使用相符的速率。
-
在 CUR 中預期標籤之前啟用標籤。成本分配標籤必須先在 AWS 帳單主控台中啟用,才能出現在 CUR 或 Cost Explorer 中。啟用後,標籤最多需要 24 小時才會開始填入。
-
針對 IAM 主體屬性使用 CUR 2.0。IAM 主體身分和標籤資料需要 CUR 2.0 (AWS 資料匯出)。如果您使用的是舊版 CUR 格式,則無法使用 IAM 主體欄位。每個金鑰的成本明細都以兩種 CUR 格式提供。如需詳細設定說明,請參閱使用 IAM 主體進行成本分配。