View a markdown version of this page

CloudWatch メトリクスを使用してbedrock-mantle推論をモニタリングする - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CloudWatch メトリクスを使用してbedrock-mantle推論をモニタリングする

Amazon Bedrock OpenAI 互換エンドポイント (bedrock-mantle.region.api.aws) は、 AWS/BedrockMantle名前空間の Amazon CloudWatch に顧客向けメトリクスを発行します。これらのメトリクスを使用して、、 AWS アカウントプロジェクト、モデル全体の推論ボリューム、トークン消費、エラー率をモニタリングします。

アプリケーションで ConverseConverseStreamInvokeModel、または InvokeModelWithResponseStream bedrock-runtime.region.amazonaws.comを使用して を介して推論を呼び出す場合は、Amazon Bedrock ランタイムメトリクス代わりに「」を参照してください。 bedrock-mantleメトリクスは、bedrock-mantleエンドポイントの Responses API、Chat Completions API、および Anthropic Messages API を通じて発行された推論のみを対象としています。

bedrock-mantle は、4 つの詳細レベルでメトリクスを発行します。各レベルは、「」で説明されているように、CloudWatch ディメンションの異なる組み合わせを使用しますディメンション。すべてのメトリクスは にスコープされます AWS アカウント。

推論メトリクス

推論メトリクス
メトリクス名 Unit 説明
Inferences カウント Responses、Chat Completions、APIs 全体で完了した推論リクエストの合計数。Account、Project、Model、Project+Model レベルで公開されます。
InferenceClientErrors カウント クライアント側 (4xx) エラーで失敗した推論リクエストの数。Account、Project、Model、Project+Model レベルで公開されます。

トークンメトリクス

トークンメトリクス
メトリクス名 Unit 説明
TotalInputTokens カウント 発行間隔内に処理された請求可能な入力トークンを集計します。アカウント、プロジェクト、モデルレベルで公開されます。合計とレートの計算に を使用します。
TotalOutputTokens カウント 発行間隔内に生成された請求可能な出力トークンを集計します。アカウント、プロジェクト、モデルレベルで公開されます。
InputTokens カウント 推論ごとの請求可能な入力トークン。完了した推論ごとに 1 つのデータムが出力されます。Project+Model レベルでのみ公開されます。これは、リクエストごとのトークン数のパーセンタイル統計 (p50/p90/p99) が必要な場合に使用します。
OutputTokens カウント 推論ごとの請求可能な出力トークン。完了した推論ごとに 1 つのデータムが出力されます。Project+Model レベルでのみ公開されます。

ディメンション

ディメンション
ディメンション名 適用先
Project 推論リクエストに関連付けられたプロジェクト ID。 プロジェクト、プロジェクト+モデル
Model モデル識別子 (例: anthropic.claude-opus-4-7)。 Model、Project+Model

アカウントレベルのメトリクスは に限定 AWS アカウント され、追加のディメンションはありません。詳細度の各レベルは個別に出力されるため、プロジェクトとモデルの両方を解決できる場合、単一の推論が 4 つのレベルすべてに寄与します。

適切な粒度レベルの選択

  • アカウントレベル – 全体的な使用状況、エラー率、および集計トークンボリューム。高レベルのダッシュボードとアカウント全体のアラームに適しています。料金はモデルによって異なるため、コスト分析には適していません。

  • プロジェクトレベル – チャージバックダッシュボードとチームレベルのダッシュボードのプロジェクトごとのロールアップ。

  • モデルレベル – モデルごとの使用量とエラー率。既存のbedrock-runtimeModelIdディメンションに対して構築されたダッシュボードの移行に適しています。

  • Project+Model レベル – コスト分析、パーセンタイルレイテンシー、トークン分析のプライマリレベル。これは、同じデータムでプロジェクト属性とモデル属性の両方が必要な場合に使用します。

bedrock-runtime メトリクスとの違い

  • 名前空間を区切ります。 bedrock-mantleメトリクスは に発行されますAWS/BedrockMantle。に対して構築された既存のダッシュボードとアラームAWS/Bedrockでは、bedrock-mantleトラフィックは取得されません。

  • 命名。 bedrock-mantleは、 Inferencesではなく InvocationsTotalInputTokens および TotalOutputTokensではなく InputTokenCount OutputTokenCountInferenceClientErrorsではなく を使用しますInvocationClientErrors

  • プロジェクトディメンション。 bedrock-mantleメトリクスは、bedrock-runtimeメトリクスにないProjectディメンションを持ち、プロジェクトごとのコスト属性を有効にします。

  • クロスリージョン推論。 bedrock-mantleはリージョン内のみです。メトリクスは、リクエストを処理したリージョンで出力され、クロスリージョン推論 (CRIS) トラフィックが にあるようにリージョン間で集計されませんbedrock-runtime

  • レイテンシーメトリクス。 InvocationLatencyおよびTimeToFirstToken同等の はまだ によって公開されていませんbedrock-mantle

bedrock-mantle メトリクスの表示

CloudWatch コンソールでbedrock-mantleメトリクスを表示するには:

  1. CloudWatch コンソールを開きます。

  2. ナビゲーションペインで、[Metrics][ll metrics] を選択します。

  3. AWS/BedrockMantle 名前空間を選択します。

  4. クエリに一致するディメンションセット (Project, Modelproject-and-model内訳など) を選択して、粒度レベルを選択します。

bedrock-mantle メトリクスを読み取るには、適切な CloudWatch アクセス許可が必要です。詳細については、Amazon CloudWatch ユーザーガイド」の「Amazon CloudWatch の認証とアクセスコントロール」を参照してください。 Amazon CloudWatch