翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Bedrock のコストと使用状況レポートデータを理解する
AWS データエクスポートのコストと使用状況レポート (CUR 2.0) は、詳細なコストと使用状況データを受け取るために AWS 推奨される方法です。CUR 2.0 は、すべての Amazon Bedrock 推論リクエストの明細項目の詳細を提供します。リクエストごとにトークンタイプごとに個別の明細項目が生成され、使用タイプと単価が異なります。このページでは、CUR で Amazon Bedrock エントリを読み、実際の支出と照合する方法について説明します。 AWS CUR 2.0 の詳細については、AWS 「データエクスポートドキュメント」を参照してください。
CUR での Amazon Bedrock の料金について
CUR での Amazon Bedrock の料金は、トークンタイプ、サービス層、リクエストがクロスリージョン推論を介してルーティングされたかどうかの 3 つの要因によって決まります。これらそれぞれを理解することは、正確なコスト調整に不可欠です。
トークンタイプ
Amazon Bedrock の料金は、4 つのトークンタイプに分かれています。それぞれに異なる単価があります。
| トークンタイプ | CUR 使用タイプパターン | 説明 |
|---|---|---|
| 入力トークン | *-input-tokens、または *-mantle-input-tokens-* |
リクエストプロンプトで送信されたトークン |
| 出力トークン | *-output-tokens、または *-mantle-output-tokens-* |
レスポンスで生成されたトークン |
| キャッシュ読み取りトークン | *-cache-read-input-token-count |
プロンプトキャッシュから読み取られたトークン (入力よりもかなり安価) |
| キャッシュ書き込みトークン | *-cache-write-input-token-count |
プロンプトキャッシュに書き込まれたトークン (入力よりも高価) |
重要
使用量を調整するときは、4 つのトークンタイプすべてを考慮する必要があります。入力トークンと出力トークンのみを合計した場合、合計は請求書と一致しません。これは、特にプロンプトキャッシュを頻繁に使用するワークロードにおいて、調整ギャップの最も一般的な原因です。
サービス階層
Amazon Bedrock は、料金と可用性に影響するさまざまなサービス層をサポートしています。リクエストのサービス階層は CUR 使用タイプに反映されます。コストを調整するときは、各明細項目に関連付けられたサービス階層に正しい単価を適用してください。
サービス階層とそのサービス階層が推論料金に与える影響の詳細については、「」を参照してくださいパフォーマンスとコストを最適化するためのサービス階層。
CUR 使用タイプの例
line_item_usage_type フィールドは、モデル、トークンタイプ、サービス階層、およびリクエストがクロスリージョン推論を使用したかどうかを識別します。形式はエンドポイントによって異なります。
-
{region}-{model}-{token-type}bedrock-runtime標準階層リクエストの場合 -
{region}-{model}-{token-type}-{tier}bedrock-runtime優先度または柔軟な階層リクエストの場合 -
{region}-{model}-mantle-{token-type}-standardbedrock-mantleリクエストの -
{region}-{model}-{token-type}-cross-region-globalクロスリージョンリクエストの場合
| 使用タイプ | モデル | サービス階層 | トークンタイプ | ルーティング |
|---|---|---|---|---|
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard |
OpenAI gpt-oss-120b | 標準 | Input | リージョン内 |
USE1-gpt-oss-120b-output-tokens-priority |
OpenAI gpt-oss-120b | 優先度 | Output | リージョン内 |
USE1-Nova2.0Lite-input-tokens-flex |
Amazon Nova 2 Lite | Flex | Input | リージョン内 |
USE1-Claude4.6Sonnet-input-tokens |
Claude Sonnet 4.6 | 標準 | Input | リージョン内 |
USE1-Claude4.6Sonnet-cache-read-input-token-count |
Claude Sonnet 4.6 | 標準 | キャッシュ読み取り | リージョン内 |
USE1-Claude4.6Sonnet-output-tokens-cross-region-global |
Claude Sonnet 4.6 | 標準 | Output | クロスリージョン |
CUR のコスト配分タグ
IAM プリンシパル、プロジェクト、アプリケーション推論プロファイルからのコスト配分タグは、CUR の列としてプレフィックス resourceTags/{key}と とともに表示されますiamPrincipal/{key}。 アプリケーション推論プロファイルたとえば、 キーを持つタグは としてTeam表示されますresourceTags/Team。
| 属性メソッド | CUR でのタグの表示方法 |
|---|---|
| IAM プリンシパルタグ | リクエストを行う IAM ユーザーまたはロールからのタグ |
| セッションタグ | ロールの引き受けまたはフェデレーション中に渡されるタグ |
| プロジェクトタグ | Amazon Bedrock プロジェクトに割り当てられたタグ |
| アプリケーション推論プロファイルタグ | アプリケーション推論プロファイルに割り当てられたタグ |
タグは、CUR に表示される前に、 AWS 請求コンソールでコスト配分タグとしてアクティブ化する必要があります。詳細については、「コスト配分タグのアクティブ化」を参照してください。
CUR データを読み取るときに知っておくべき重要なこと
CUR データを最大限に活用し、コストを分析する際の混乱を回避するには、次の点に注意してください。
-
すべてのトークンタイプを考慮します。Amazon Bedrock は、入力トークン、出力トークン、キャッシュ読み取りトークン、キャッシュ書き込みトークンに対して個別に料金を請求します。それぞれに異なる単価があります。入力トークンと出力トークンのみを見ると、特にプロンプトキャッシュを頻繁に使用するワークロードでは、分析によってコストが削減されます。
-
ルーティングタイプごとに正しいレートを適用します。リージョン内推論とクロスリージョン推論の単価は異なります。ワークロードが両方を使用している場合は、コストを分析するときに、それぞれに一致率を使用してください。
-
CUR で想定する前にタグをアクティブ化します。コスト配分タグは、CUR または Cost Explorer に表示される前に、 AWS 請求コンソールでアクティブ化する必要があります。アクティベーション後、タグの入力を開始するまでに最大 24 時間かかります。
-
IAM プリンシパル属性には CUR 2.0 を使用します。IAM プリンシパル ID とタグデータには CUR 2.0 (AWS データエクスポート) が必要です。レガシー CUR 形式を使用している場合、IAM プリンシパルフィールドは使用できません。トークンごとのコスト内訳は、両方の CUR 形式で利用できます。詳細なセットアップ手順については、「コスト配分に IAM プリンシパルを使用する」を参照してください。