評価者の反射/絞り込みループパターン - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

評価者の反射/絞り込みループパターン

コード生成、要約、自律的な意思決定などのタスクは、ランタイムフィードバックから大きなメリットを得るため、システムは監視と改良を通じて進化できます。これを運用するために、リフレクションと改良のサイクルをイベント駆動型のフィードバック制御ループとして実装できます。これは、自律的でインテリジェントなワークフローに適したシステムエンジニアリングに着想を得たパターンです。

次の図は、評価者のリフレクション/絞り込みフィードバックループの例です。

評価者はフィードバックループをリフレクション/絞り込みます。

フィードバックコントロールループ

フィードバックコントロールループは、独自の出力と動作をモニタリングし、定義された基準または目的の状態に照らして評価し、それに応じてアクションを調整するパターンです。このアーキテクチャは制御理論に着想を得ており、自動化、継続的インテグレーションと継続的デリバリー (CI/CD) パイプライン、機械学習オペレーションなどの分野で基盤となっています。

次の図は、フィードバックコントロールループの例です。

フィードバックコントロールループ。
  1. デプロイパイプラインは buildComplete イベントを出力します。

  2. イベントは、ビルドを検証する自動テストジョブまたは評価ジョブをトリガーします。

  3. 検証が失敗した場合 (テストの失敗、セキュリティの問題、ポリシー違反など)、システムは次の操作を行います。

    • buildComplete イベントを発行する

    • 問題をログに記録するか、通知を送信します

    • ロールバック、パッチ適用、再試行などの修復または修正アクションをトリガーします

ループは、許容可能な結果またはエスカレーションを生成するか、タイムアウトが発生するまで続行されます。このパターンは、一般的に以下に使用されます。

  • 評価タスクまたは修復タスクにイベントをルーティングする Amazon EventBridge ルール

  • AWS Step Functions 反復再試行ロジックと評価結果の分岐用

  • フィードバックトリガーとアラートの Amazon Simple Notification Service (Amazon SNS) または Amazon CloudWatch アラーム

  • AWS Lambda 是正措置を適用するための 関数またはコンテナ化されたワーカー

フィードバックコントロールループ (評価者)

評価者ワークフローは、LLMsまたは推論エージェントを搭載した認知フィードバックループです。このプロセスは、以下で構成されます。

  1. ジェネレーターエージェントまたは LLM は出力 (計画、回答、ドラフトなど) を生成します。

  2. 評価者エージェントは、批評プロンプトまたは評価ルーブリックを使用して結果を確認します。

  3. フィードバックに基づいて、元のエージェントまたは新しいオプティマイザエージェントが出力を修正します。

ループは、結果が一連の基準を満たすか、承認されるか、再試行制限に達するまで繰り返されます。

評価者

  1. ユーザーは、ポリシーの概要を書き込むようにエージェントに依頼します。

  2. ジェネレーターエージェントはそれをドラフトします。

  3. 評価者エージェントは、カバレッジ、トーン、法的正確性をチェックします。

  4. レスポンスが不十分な場合は、フィードバックループが収束するまで絞り込まれ、再送信されます。

これにより、自己評価、反復的な絞り込み、適応的な出力制御がすべて人間による入力なしで可能になります。

次の図は、フィードバックコントロールループ (評価者) の例です。

フィードバックコントロールループ (評価者)。
  1. ユーザーがタスクを発行する (ビジネス戦略のドラフトを作成するなど)。

  2. Amazon Bedrock エージェントは、LLM を使用して最初のドラフトを生成します。

  3. 2 番目のエージェント (またはフォローアッププロンプト) は構造化された評価 (たとえば、「この出力を明確さ、完全性、トーンで評価する」) を実行します。

  4. 評価がしきい値を下回ると、レスポンスは次のように修正されます。

    • 批評が埋め込まれたジェネレーターの再呼び出し

    • 特殊なリファイナーエージェントにフィードバックを送信する

    • 許容可能な応答に達するまで反復する

AWS Lambda コントローラーや などのオプションコンポーネントは、フィードバックのしきい値、再試行、フォールバック戦略を管理 AWS Step Functions できます。

重要事項

従来のフィードバックコントロールループがイベント、メトリクス、修復ロジックを使用してシステム動作を検証および調整する場合、エージェント評価者ループは推論エージェントを使用して出力を動的に評価、反映、修正します。

両方のパラダイムで:

  • 出力は生成後に評価されます

  • 修正アクションまたは改良アクションは、フィードバックに基づいてトリガーされます

  • システムが目標品質または目標に継続的に適応する

エージェントバージョンは静的検証をセマンティックリフレクションに変換し、独自の有効性を評価する自己改善エージェントを可能にします。