CUR での Amazon Bedrock の料金について CUR 使用タイプの例 CUR のコスト配分タグ CUR データを読み取るときに知っておくべき重要なこと

Amazon Bedrock のコストと使用状況レポートデータを理解する

AWS データエクスポートのコストと使用状況レポート (CUR 2.0) は、詳細なコストと使用状況データを受け取るために AWS 推奨される方法です。CUR 2.0 は、すべての Amazon Bedrock 推論リクエストの明細項目の詳細を提供します。リクエストごとにトークンタイプごとに個別の明細項目が生成され、使用タイプと単価が異なります。このページでは、CUR で Amazon Bedrock エントリを読み、実際の支出と照合する方法について説明します。 AWS CUR 2.0 の詳細については、AWS 「データエクスポートドキュメント」を参照してください。

CUR での Amazon Bedrock の料金について

CUR での Amazon Bedrock の料金は、トークンタイプ、サービス層、リクエストがクロスリージョン推論を介してルーティングされたかどうかの 3 つの要因によって決まります。これらそれぞれを理解することは、正確なコスト調整に不可欠です。

トークンタイプ

Amazon Bedrock の料金は、4 つのトークンタイプに分かれています。それぞれに異なる単価があります。

トークンタイプ	CUR 使用タイプパターン	説明
入力トークン	`-input-tokens`、または `-mantle-input-tokens-*`	リクエストプロンプトで送信されたトークン
出力トークン	`-output-tokens`、または `-mantle-output-tokens-*`	レスポンスで生成されたトークン
キャッシュ読み取りトークン	`*-cache-read-input-token-count`	プロンプトキャッシュから読み取られたトークン (入力よりもかなり安価)
キャッシュ書き込みトークン	`*-cache-write-input-token-count`	プロンプトキャッシュに書き込まれたトークン (入力よりも高価)

重要

使用量を調整するときは、4 つのトークンタイプすべてを考慮する必要があります。入力トークンと出力トークンのみを合計した場合、合計は請求書と一致しません。これは、特にプロンプトキャッシュを頻繁に使用するワークロードにおいて、調整ギャップの最も一般的な原因です。

サービス階層

Amazon Bedrock は、料金と可用性に影響するさまざまなサービス層をサポートしています。リクエストのサービス階層は CUR 使用タイプに反映されます。コストを調整するときは、各明細項目に関連付けられたサービス階層に正しい単価を適用してください。

サービス階層とそのサービス階層が推論料金に与える影響の詳細については、「」を参照してくださいパフォーマンスとコストを最適化するためのサービス階層。

CUR 使用タイプの例

line_item_usage_type フィールドは、モデル、トークンタイプ、サービス階層、およびリクエストがクロスリージョン推論を使用したかどうかを識別します。形式はエンドポイントによって異なります。

{region}-{model}-{token-type} bedrock-runtime標準階層リクエストの場合
{region}-{model}-{token-type}-{tier} bedrock-runtime優先度または柔軟な階層リクエストの場合
{region}-{model}-mantle-{token-type}-standard bedrock-mantleリクエストの
{region}-{model}-{token-type}-cross-region-global クロスリージョンリクエストの場合

使用タイプ	モデル	サービス階層	トークンタイプ	ルーティング
`USE1-openai.gpt-oss-120b-mantle-input-tokens-standard`	OpenAI gpt-oss-120b	標準	Input	リージョン内
`USE1-gpt-oss-120b-output-tokens-priority`	OpenAI gpt-oss-120b	優先度	Output	リージョン内
`USE1-Nova2.0Lite-input-tokens-flex`	Amazon Nova 2 Lite	Flex	Input	リージョン内
`USE1-Claude4.6Sonnet-input-tokens`	Claude Sonnet 4.6	標準	Input	リージョン内
`USE1-Claude4.6Sonnet-cache-read-input-token-count`	Claude Sonnet 4.6	標準	キャッシュ読み取り	リージョン内
`USE1-Claude4.6Sonnet-output-tokens-cross-region-global`	Claude Sonnet 4.6	標準	Output	クロスリージョン

CUR のコスト配分タグ

IAM プリンシパル、プロジェクト、アプリケーション推論プロファイルからのコスト配分タグは、CUR の列としてプレフィックス resourceTags/{key}ととともに表示されますiamPrincipal/{key}。アプリケーション推論プロファイルたとえば、キーを持つタグはとしてTeam表示されますresourceTags/Team。

属性メソッド	CUR でのタグの表示方法
IAM プリンシパルタグ	リクエストを行う IAM ユーザーまたはロールからのタグ
セッションタグ	ロールの引き受けまたはフェデレーション中に渡されるタグ
プロジェクトタグ	Amazon Bedrock プロジェクトに割り当てられたタグ
アプリケーション推論プロファイルタグ	アプリケーション推論プロファイルに割り当てられたタグ

タグは、CUR に表示される前に、 AWS 請求コンソールでコスト配分タグとしてアクティブ化する必要があります。詳細については、「コスト配分タグのアクティブ化」を参照してください。

CUR データを読み取るときに知っておくべき重要なこと

CUR データを最大限に活用し、コストを分析する際の混乱を回避するには、次の点に注意してください。

すべてのトークンタイプを考慮します。Amazon Bedrock は、入力トークン、出力トークン、キャッシュ読み取りトークン、キャッシュ書き込みトークンに対して個別に料金を請求します。それぞれに異なる単価があります。入力トークンと出力トークンのみを見ると、特にプロンプトキャッシュを頻繁に使用するワークロードでは、分析によってコストが削減されます。
ルーティングタイプごとに正しいレートを適用します。リージョン内推論とクロスリージョン推論の単価は異なります。ワークロードが両方を使用している場合は、コストを分析するときに、それぞれに一致率を使用してください。
CUR で想定する前にタグをアクティブ化します。コスト配分タグは、CUR または Cost Explorer に表示される前に、 AWS 請求コンソールでアクティブ化する必要があります。アクティベーション後、タグの入力を開始するまでに最大 24 時間かかります。
IAM プリンシパル属性には CUR 2.0 を使用します。IAM プリンシパル ID とタグデータには CUR 2.0 (AWS データエクスポート) が必要です。レガシー CUR 形式を使用している場合、IAM プリンシパルフィールドは使用できません。トークンごとのコスト内訳は、両方の CUR 形式で利用できます。詳細なセットアップ手順については、「コスト配分に IAM プリンシパルを使用する」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

リクエストごとのメタデータのタグ付け

その他の機能