モデル呼び出し - Amazon CloudWatch

モデル呼び出し

CloudWatch 生成 AI オブザーバビリティを使用すると、モデル呼び出しのパフォーマンスをモニタリングできます。すぐに使用できるビューを使用して、呼び出し数、トークンの使用状況、エラーなどのメトリクスを追跡できます。入力や出力などの呼び出しコンテンツを詳細に可視化するには、Bedrock 呼び出しログ記録を有効にし、ログを CloudWatch に送信します。詳細については、「Set up a CloudWatch Logs destination」および「Help protect sensitive log data with masking」を参照してください。

Amazon Bedrock でのモデル呼び出しの有効化

注記

呼び出しを表示するには、Amazon Bedrock でモデル呼び出しのログ記録を有効にする必要があります。

Amazon Bedrock でモデル呼び出しログ記録を有効にするには、以下の手順に従います。

  1. Amazon Bedrock コンソール (https://console.aws.amazon.com/bedrock/) を開きます。

  2. [設定] を選択します。

  3. [モデル呼び出しのログ記録] で、[モデル呼び出しのログ記録] を選択します。

  4. ログに含める必要なデータ型を選択します。ログを CloudWatch Logs のみに送信するか、Amazon S3 と CloudWatch Logs の両方に送信するかを選択します。

  5. CloudWatch Logs 設定で、ロググループ名を作成し、適切なサービスロールを選択します。

  6. ログに含める必要なデータ型を選択します。

  7. [設定を保存] を選択します

    Amazon Bedrock 呼び出しの使用を開始すると、事前設定されたダッシュボードを自動的に表示できます。Model Invocation logging を有効にすると、デフォルトのダッシュボードを表示し、その下の呼び出しテーブルにアクセスできます。

生成 AI オブザーバビリティ
  • 呼び出し数ConverseConverseStreamInvokeModelInvokeModelWithResponseStream API オペレーションに対する成功したリクエストの数

  • 呼び出しレイテンシー – 呼び出しのレイテンシー

  • モデル別のトークン数 – 入力トークン数と出力トークン数で示されるモデル別のトークン数

  • ModelID 別の日次トークン数 – モデル ID 別の日次合計トークン数

  • InputTokenCount、OutputTokenCount – 選択したモデル全体でのこのアカウントの入出力トークンの合計数

  • 入力トークンでグループ化されたリクエスト – 入力トークンでグループ化されたリクエストの数を 6 つの範囲に分類します。各行は、特定の範囲に含まれるリクエストの数を表します

  • 呼び出しスロットリング – システムがスロットリングした呼び出しの数。表示されるスロットリングの数は、SDK の再試行設定によって異なります。詳細については、「AWS SDK とツールのリファレンスガイド」の「Retry」を参照してください

  • 呼び出しエラー数 – サーバー側およびクライアント側のエラーが発生する呼び出しの数

モデル呼び出しダッシュボードを使用するには、以下の手順に従います。

  1. メトリクスグラフにカーソルを合わせて、呼び出しの詳細を表示します。[アラーム] アイコンを選択して、Alarms を設定し、アプリケーションの品質とパフォーマンスをモニタリングできます。アラームの設定については、「メトリクスに関する警告」を参照してください。メトリクスの詳細については、「Amazon Bedrock runtime metrics」を参照してください。

  2. [ModelID] ドロップダウンでモデル ID を選択して、対応するメトリクスを表示できます。

  3. [CloudWatch メトリクスで表示] を選択して、CloudWatch のダッシュボードメトリクスを表示します。

  4. [期間の上書き] を選択して、メトリクスの時間枠 (1 分、1 時間、6 時間など) を調整します。

  5. [呼び出し] で、[リクエスト ID] を選択してリクエストの詳細を表示します。モデル呼び出しの入力と出力の詳細を右ペインで表示できます。

モデル呼び出し - リクエスト ID ビュー

[リクエスト ID] ページの [アクション] ドロップダウンで、[Logs Insights で表示] を選択して CloudWatch でログを表示します。詳細については、「CloudWatch Logs Insights を使用したログデータの分析」を参照してください。