翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
CloudWatch メトリクスを使用してbedrock-mantle推論をモニタリングする
Amazon Bedrock OpenAI 互換エンドポイント (bedrock-mantle.) は、 region.api.awsAWS/BedrockMantle名前空間の Amazon CloudWatch に顧客向けメトリクスを発行します。これらのメトリクスを使用して、、 AWS アカウントプロジェクト、モデル全体の推論ボリューム、トークン消費、エラー率をモニタリングします。
アプリケーションで Converse、ConverseStream、InvokeModel、または InvokeModelWithResponseStream bedrock-runtime.を使用して を介して推論を呼び出す場合は、Amazon Bedrock ランタイムメトリクス代わりに「」を参照してください。 region.amazonaws.com.rproxy.govskope.cabedrock-mantleメトリクスは、bedrock-mantleエンドポイントの Responses API、Chat Completions API、および Anthropic Messages API を通じて発行された推論のみを対象としています。
bedrock-mantle は、4 つの詳細レベルでメトリクスを発行します。各レベルは、「」で説明されているように、CloudWatch ディメンションの異なる組み合わせを使用しますディメンション。すべてのメトリクスは にスコープされます AWS アカウント。
推論メトリクス
| メトリクス名 | Unit | 説明 |
|---|---|---|
Inferences |
カウント | Responses、Chat Completions、APIs 全体で完了した推論リクエストの合計数。Account、Project、Model、Project+Model レベルで公開されます。 |
InferenceClientErrors |
カウント | クライアント側 (4xx) エラーで失敗した推論リクエストの数。Account、Project、Model、Project+Model レベルで公開されます。 |
トークンメトリクス
| メトリクス名 | Unit | 説明 |
|---|---|---|
TotalInputTokens |
カウント | 発行間隔内に処理された請求可能な入力トークンを集計します。アカウント、プロジェクト、モデルレベルで公開されます。合計とレートの計算に を使用します。 |
TotalOutputTokens |
カウント | 発行間隔内に生成された請求可能な出力トークンを集計します。アカウント、プロジェクト、モデルレベルで公開されます。 |
InputTokens |
カウント | 推論ごとの請求可能な入力トークン。完了した推論ごとに 1 つのデータムが出力されます。Project+Model レベルでのみ公開されます。これは、リクエストごとのトークン数のパーセンタイル統計 (p50/p90/p99) が必要な場合に使用します。 |
OutputTokens |
カウント | 推論ごとの請求可能な出力トークン。完了した推論ごとに 1 つのデータムが出力されます。Project+Model レベルでのみ公開されます。 |
ディメンション
| ディメンション名 | 値 | 適用先 |
|---|---|---|
Project |
推論リクエストに関連付けられたプロジェクト ID。 | プロジェクト、プロジェクト+モデル |
Model |
モデル識別子 (例: anthropic.claude-opus-4-7)。 |
Model、Project+Model |
アカウントレベルのメトリクスは に限定 AWS アカウント され、追加のディメンションはありません。詳細度の各レベルは個別に出力されるため、プロジェクトとモデルの両方を解決できる場合、単一の推論が 4 つのレベルすべてに寄与します。
適切な粒度レベルの選択
-
アカウントレベル – 全体的な使用状況、エラー率、および集計トークンボリューム。高レベルのダッシュボードとアカウント全体のアラームに適しています。料金はモデルによって異なるため、コスト分析には適していません。
-
プロジェクトレベル – チャージバックダッシュボードとチームレベルのダッシュボードのプロジェクトごとのロールアップ。
-
モデルレベル – モデルごとの使用量とエラー率。既存の
bedrock-runtimeModelIdディメンションに対して構築されたダッシュボードの移行に適しています。 -
Project+Model レベル – コスト分析、パーセンタイルレイテンシー、トークン分析のプライマリレベル。これは、同じデータムでプロジェクト属性とモデル属性の両方が必要な場合に使用します。
bedrock-runtime メトリクスとの違い
-
名前空間を区切ります。
bedrock-mantleメトリクスは に発行されますAWS/BedrockMantle。に対して構築された既存のダッシュボードとアラームAWS/Bedrockでは、bedrock-mantleトラフィックは取得されません。 -
命名。
bedrock-mantleは、InferencesではなくInvocations、TotalInputTokensおよびTotalOutputTokensではなくInputTokenCountOutputTokenCount、InferenceClientErrorsではなく を使用しますInvocationClientErrors。 -
プロジェクトディメンション。
bedrock-mantleメトリクスは、bedrock-runtimeメトリクスにないProjectディメンションを持ち、プロジェクトごとのコスト属性を有効にします。 -
クロスリージョン推論。
bedrock-mantleはリージョン内のみです。メトリクスは、リクエストを処理したリージョンで出力され、クロスリージョン推論 (CRIS) トラフィックが にあるようにリージョン間で集計されませんbedrock-runtime。 -
レイテンシーメトリクス。
InvocationLatencyおよびTimeToFirstToken同等の はまだ によって公開されていませんbedrock-mantle。
bedrock-mantle メトリクスの表示
CloudWatch コンソールでbedrock-mantleメトリクスを表示するには:
-
CloudWatch コンソールを開きます。
-
ナビゲーションペインで、[Metrics]、[ll metrics] を選択します。
-
AWS/BedrockMantle名前空間を選択します。 -
クエリに一致するディメンションセット (
Project, Modelproject-and-model内訳など) を選択して、粒度レベルを選択します。
bedrock-mantle メトリクスを読み取るには、適切な CloudWatch アクセス許可が必要です。詳細については、Amazon CloudWatch ユーザーガイド」の「Amazon CloudWatch の認証とアクセスコントロール」を参照してください。 Amazon CloudWatch