エージェントビュー - Amazon CloudWatch

エージェントビュー

[エージェントビュー] には、アカウントのエージェント用に厳選されたダッシュボードが表示されます。AgentCore ランタイム、Lambda、Amazon EC2 などの AWS ネイティブサービスでホストされているエージェントのデータを表示できます。ビューには、CloudWatch にテレメトリを出力するエージェントも表示されます。

概要:

メトリクスとダッシュボードには、サンプリングされたエージェントスパンのデータが表示されます。エージェントスパンの詳細については、「Spans」を参照してください。

以下のエージェントメトリクスがサポートされています。

  • エージェント/エンドポイント – 計測され、スパンを出力するエージェントとエイリアスの数

  • セッション – スパンを出力する計測されたエージェントが作成したセッションの数。セッションは会話に似ており、幅広いコンテキストが含まれています

  • トレース – スパンを出力する計測されたエージェントが作成したトレースの数。トレースは、セッション内の個々のリクエスト/レスポンスサイクルです

  • エラー率 – エージェントインタラクションのエラーの割合

  • スロットリングレート – スロットリングされたエージェントのインタラクションの割合

[詳細を表示] を選択して、エージェントメトリクスをグラフで表示します。

エージェントビュー

ランタイムメトリクス

ランタイムメトリクスとダッシュボードには、ランタイムプリミティブのデータが表示されます。このプリミティブを使用すると、Amazon Bedrock AgentCore ランタイムでエージェントをホストできます。詳細については、「Creating an AgentCore Runtime」を参照してください。

AgentCore ランタイムはこれらのメトリクスをサポートします

  • ランタイムエージェント/エイリアス – AgentCore ランタイムでホストされているエージェントとエイリアスの数を追跡します

  • ランタイムセッション – AgentCore ランタイムで実行されているエージェントが作成したセッションの数を追跡します。セッションは会話に似ており、インタラクションフロー全体の広範なコンテキストが含まれています。プラットフォームの全体的な使用状況のモニタリング、キャパシティプランニング、ユーザーエンゲージメントパターンの理解に役立ちます

  • ランタイム呼び出し – データプレーン API に対して行われたリクエストの合計数。リクエストペイロードサイズやレスポンスステータスに関係なく、各 API コールは 1 回の呼び出しとしてカウントされます

  • ランタイムエラー – システムエラーとユーザーエラーの数。システムおよびユーザーのエラー定義については、「AgentCore provided runtime metrics」を参照してください

  • ランタイムスロットリング – 許可された TPS (1 秒あたりのトランザクション) を超えたためにサービスによってスロットリングされたリクエストの数。これらのリクエストは、HTTP ステータスコード 429 の ThrottlingException を返します。このメトリクスをモニタリングして、サービスクォータの確認やリクエストパターンの最適化が必要かどうかを判断します

デフォルトのダッシュボードで、時間の経過に伴うメトリクスの変化を表示します。[詳細を表示] を展開してメトリクスグラフを表示します。

ランタイムビュー

[エージェント]  

エージェントは、アプリケーションからモニタリングデータを収集して送信するコンポーネントです。エージェントテーブルには、アカウントで設定されたすべてのエージェントが表示されます。これらのエージェントは、AgentCore ランタイム、Lambda、Amazon EC2 などの AWS ネイティブサービスでホストできます。このテーブルには、テレメトリを CloudWatch に出力するように計測された他のエージェントも表示されます。

[エージェントをフィルタリング] を使用して、深く掘り下げたい特定のエージェントを見つけたり、列名を使用してエージェントをソートし必要なエージェントを見つけることもできます。歯車アイコンを選択して、追加の列を表示または非表示にします。

ランタイムエージェントビュー

エージェント名を展開することで、エージェントの詳細を表示できます。

ランタイムエージェントの概要

エージェントの詳細 - 概要

[概要] タブには、エージェントメトリクスの自動ダッシュボードが表示されます。これらのメトリクスは、サンプリングされたスパンとランタイムメトリクス (エージェントが AgentCore ランタイムを使用する場合) から取得されます。

[評価者] ダッシュボードには、評価が有効になっているスパンから導出されたインサイトが含まれます。

  • 差分が上位のエバリュエータースコア — 選択した期間に基づいて、最後の期間以降に最も変化があったエージェントエバリュエーターを表示します。

  • 評価設定メトリクス — 評価が実行された回数や発生したエラーの数など、エージェントエバリュエーターの運用ステータスメトリクスを表示します。

Amazon Bedrock AgentCore コンソールを使用して評価設定を編集するには、[評価者] または [評価設定] 列のリンクをクリックします。エバリュエーターの結果を確認するには、[平均スコア] 列のスコアをクリックします。エージェントのすべての評価を表示するには、[評価] タブを選択します。詳細については、「エージェントの詳細 - 評価」を参照してください。

[エージェントのメトリクス] ダッシュボードには、サンプリングされたスパンから派生した以下のメトリクスが含まれています。

  • セッションとトレース — このエージェントのセッションとトレースの数

  • FM トークンの使用 – 基礎モデルトークン消費の合計数。チャートを特定の基礎モデルにフィルタリングできます

  • システムエラーとクライアントエラー – リクエスト処理中のシステムエラーの数。サーバー側のエラーレベルが高い場合は、調査が必要な潜在的なインフラストラクチャまたはサービスの問題がある可能性があります。クライアントエラーは、無効なリクエストに起因するエラーです。クライアント側のエラーレベルが高い場合は、リクエストのフォーマットやアクセス許可に問題がある可能性があります

  • スパン別のエラーとレイテンシー – 特定のスパン別のエラー率とレイテンシー。スパンは多くのエージェントに表示される可能性があることに注意してください

  • スロットリング – 許可された TPS (1 秒あたりのトランザクション数) を超えたためにサービスによってスロットリングされたリクエストの数

  • インバウンド Auth:Authorization およびアクセストークン呼び出し – エージェントによって処理された受信認証リクエストの数。外部クライアントまたはサービスからの認可チェックやアクセストークン検証を含みます。

  • アウトバウンド Auth:Usage 分散 – エージェントが使用するアウトバウンド認証方法の分散パターン。外部サービスにアクセスするときに使用される認証メカニズムの頻度とタイプを示します。

[ランタイムメトリクス] ダッシュボードには、AgentCore ランタイムが自動的に生成する以下のメトリクスが含まれています。

  • ランタイムセッションと呼び出し – ランタイムでのホスト中にこの特定のエージェントが生成したセッションと呼び出しの数

  • ランタイムレイテンシー – ランタイムでホストされるエージェントによるリクエストのレイテンシー

  • ランタイムスロットリング – 許可された TPS (1 秒あたりのトランザクション数) を超えたためにサービスによってスロットリングされたリクエストの数