View a markdown version of this page

Amazon Bedrock のコストと使用状況レポートデータを理解する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Bedrock のコストと使用状況レポートデータを理解する

AWS データエクスポートのコストと使用状況レポート (CUR 2.0) は、詳細なコストと使用状況データを受け取るために AWS 推奨される方法です。CUR 2.0 は、すべての Amazon Bedrock 推論リクエストの明細項目の詳細を提供します。リクエストごとにトークンタイプごとに個別の明細項目が生成され、使用タイプと単価が異なります。このページでは、CUR で Amazon Bedrock エントリを読み、実際の支出と照合する方法について説明します。 AWS CUR 2.0 の詳細については、AWS 「データエクスポートドキュメント」を参照してください。

CUR での Amazon Bedrock の料金について

CUR での Amazon Bedrock の料金は、トークンタイプ、サービス層、リクエストがクロスリージョン推論を介してルーティングされたかどうかの 3 つの要因によって決まります。これらそれぞれを理解することは、正確なコスト調整に不可欠です。

トークンタイプ

Amazon Bedrock の料金は、4 つのトークンタイプに分かれています。それぞれに異なる単価があります。

トークンタイプ CUR 使用タイプパターン 説明
入力トークン *-input-tokens、または *-mantle-input-tokens-* リクエストプロンプトで送信されたトークン
出力トークン *-output-tokens、または *-mantle-output-tokens-* レスポンスで生成されたトークン
キャッシュ読み取りトークン *-cache-read-input-token-count プロンプトキャッシュから読み取られたトークン (入力よりもかなり安価)
キャッシュ書き込みトークン *-cache-write-input-token-count プロンプトキャッシュに書き込まれたトークン (入力よりも高価)
重要

使用量を調整するときは、4 つのトークンタイプすべてを考慮する必要があります。入力トークンと出力トークンのみを合計した場合、合計は請求書と一致しません。これは、特にプロンプトキャッシュを頻繁に使用するワークロードにおいて、調整ギャップの最も一般的な原因です。

サービス階層

Amazon Bedrock は、料金と可用性に影響するさまざまなサービス層をサポートしています。リクエストのサービス階層は CUR 使用タイプに反映されます。コストを調整するときは、各明細項目に関連付けられたサービス階層に正しい単価を適用してください。

サービス階層とそのサービス階層が推論料金に与える影響の詳細については、「」を参照してくださいパフォーマンスとコストを最適化するためのサービス階層

CUR 使用タイプの例

line_item_usage_type フィールドは、モデル、トークンタイプ、サービス階層、およびリクエストがクロスリージョン推論を使用したかどうかを識別します。形式はエンドポイントによって異なります。

  • {region}-{model}-{token-type} bedrock-runtime標準階層リクエストの場合

  • {region}-{model}-{token-type}-{tier} bedrock-runtime優先度または柔軟な階層リクエストの場合

  • {region}-{model}-mantle-{token-type}-standard bedrock-mantleリクエストの

  • {region}-{model}-{token-type}-cross-region-global クロスリージョンリクエストの場合

使用タイプ モデル サービス階層 トークンタイプ ルーティング
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard OpenAI gpt-oss-120b 標準 Input リージョン内
USE1-gpt-oss-120b-output-tokens-priority OpenAI gpt-oss-120b 優先度 Output リージョン内
USE1-Nova2.0Lite-input-tokens-flex Amazon Nova 2 Lite Flex Input リージョン内
USE1-Claude4.6Sonnet-input-tokens Claude Sonnet 4.6 標準 Input リージョン内
USE1-Claude4.6Sonnet-cache-read-input-token-count Claude Sonnet 4.6 標準 キャッシュ読み取り リージョン内
USE1-Claude4.6Sonnet-output-tokens-cross-region-global Claude Sonnet 4.6 標準 Output クロスリージョン

CUR のコスト配分タグ

IAM プリンシパルプロジェクト、アプリケーション推論プロファイルからのコスト配分タグは、CUR の列としてプレフィックス resourceTags/{key}と とともに表示されますiamPrincipal/{key}アプリケーション推論プロファイルたとえば、 キーを持つタグは としてTeam表示されますresourceTags/Team

属性メソッド CUR でのタグの表示方法
IAM プリンシパルタグ リクエストを行う IAM ユーザーまたはロールからのタグ
セッションタグ ロールの引き受けまたはフェデレーション中に渡されるタグ
プロジェクトタグ Amazon Bedrock プロジェクトに割り当てられたタグ
アプリケーション推論プロファイルタグ アプリケーション推論プロファイルに割り当てられたタグ

タグは、CUR に表示される前に、 AWS 請求コンソールでコスト配分タグとしてアクティブ化する必要があります。詳細については、「コスト配分タグのアクティブ化」を参照してください。

CUR データを読み取るときに知っておくべき重要なこと

CUR データを最大限に活用し、コストを分析する際の混乱を回避するには、次の点に注意してください。

  • すべてのトークンタイプを考慮します。Amazon Bedrock は、入力トークン、出力トークン、キャッシュ読み取りトークン、キャッシュ書き込みトークンに対して個別に料金を請求します。それぞれに異なる単価があります。入力トークンと出力トークンのみを見ると、特にプロンプトキャッシュを頻繁に使用するワークロードでは、分析によってコストが削減されます。

  • ルーティングタイプごとに正しいレートを適用します。リージョン内推論とクロスリージョン推論の単価は異なります。ワークロードが両方を使用している場合は、コストを分析するときに、それぞれに一致率を使用してください。

  • CUR で想定する前にタグをアクティブ化します。コスト配分タグは、CUR または Cost Explorer に表示される前に、 AWS 請求コンソールでアクティブ化する必要があります。アクティベーション後、タグの入力を開始するまでに最大 24 時間かかります。

  • IAM プリンシパル属性には CUR 2.0 を使用します。IAM プリンシパル ID とタグデータには CUR 2.0 (AWS データエクスポート) が必要です。レガシー CUR 形式を使用している場合、IAM プリンシパルフィールドは使用できません。トークンごとのコスト内訳は、両方の CUR 形式で利用できます。詳細なセットアップ手順については、「コスト配分に IAM プリンシパルを使用する」を参照してください。