翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
評価者の反射/絞り込みループパターン
コード生成、要約、自律的な意思決定などのタスクは、ランタイムフィードバックから大きなメリットを得るため、システムは監視と改良を通じて進化できます。これを運用するために、リフレクションと改良のサイクルをイベント駆動型のフィードバック制御ループとして実装できます。これは、自律的でインテリジェントなワークフローに適したシステムエンジニアリングに着想を得たパターンです。
次の図は、評価者のリフレクション/絞り込みフィードバックループの例です。
フィードバックコントロールループ
フィードバックコントロールループは、独自の出力と動作をモニタリングし、定義された基準または目的の状態に照らして評価し、それに応じてアクションを調整するパターンです。このアーキテクチャは制御理論に着想を得ており、自動化、継続的インテグレーションと継続的デリバリー (CI/CD) パイプライン、機械学習オペレーションなどの分野で基盤となっています。
次の図は、フィードバックコントロールループの例です。
-
デプロイパイプラインは buildComplete イベントを出力します。
-
イベントは、ビルドを検証する自動テストジョブまたは評価ジョブをトリガーします。
-
検証が失敗した場合 (テストの失敗、セキュリティの問題、ポリシー違反など)、システムは次の操作を行います。
-
buildComplete イベントを発行する
-
問題をログに記録するか、通知を送信します
-
ロールバック、パッチ適用、再試行などの修復または修正アクションをトリガーします
-
ループは、許容可能な結果またはエスカレーションを生成するか、タイムアウトが発生するまで続行されます。このパターンは、一般的に以下に使用されます。
-
評価タスクまたは修復タスクにイベントをルーティングする Amazon EventBridge ルール
-
AWS Step Functions 反復再試行ロジックと評価結果の分岐用
-
フィードバックトリガーとアラートの Amazon Simple Notification Service (Amazon SNS) または Amazon CloudWatch アラーム
-
AWS Lambda 是正措置を適用するための 関数またはコンテナ化されたワーカー
フィードバックコントロールループ (評価者)
評価者ワークフローは、LLMsまたは推論エージェントを搭載した認知フィードバックループです。このプロセスは、以下で構成されます。
-
ジェネレーターエージェントまたは LLM は出力 (計画、回答、ドラフトなど) を生成します。
-
評価者エージェントは、批評プロンプトまたは評価ルーブリックを使用して結果を確認します。
-
フィードバックに基づいて、元のエージェントまたは新しいオプティマイザエージェントが出力を修正します。
ループは、結果が一連の基準を満たすか、承認されるか、再試行制限に達するまで繰り返されます。
評価者
-
ユーザーは、ポリシーの概要を書き込むようにエージェントに依頼します。
-
ジェネレーターエージェントはそれをドラフトします。
-
評価者エージェントは、カバレッジ、トーン、法的正確性をチェックします。
-
レスポンスが不十分な場合は、フィードバックループが収束するまで絞り込まれ、再送信されます。
これにより、自己評価、反復的な絞り込み、適応的な出力制御がすべて人間による入力なしで可能になります。
次の図は、フィードバックコントロールループ (評価者) の例です。
-
ユーザーがタスクを発行する (ビジネス戦略のドラフトを作成するなど)。
-
Amazon Bedrock エージェントは、LLM を使用して最初のドラフトを生成します。
-
2 番目のエージェント (またはフォローアッププロンプト) は構造化された評価 (たとえば、「この出力を明確さ、完全性、トーンで評価する」) を実行します。
-
評価がしきい値を下回ると、レスポンスは次のように修正されます。
-
批評が埋め込まれたジェネレーターの再呼び出し
-
特殊なリファイナーエージェントにフィードバックを送信する
-
許容可能な応答に達するまで反復する
-
AWS Lambda コントローラーや などのオプションコンポーネントは、フィードバックのしきい値、再試行、フォールバック戦略を管理 AWS Step Functions できます。
重要事項
従来のフィードバックコントロールループがイベント、メトリクス、修復ロジックを使用してシステム動作を検証および調整する場合、エージェント評価者ループは推論エージェントを使用して出力を動的に評価、反映、修正します。
両方のパラダイムで:
-
出力は生成後に評価されます
-
修正アクションまたは改良アクションは、フィードバックに基づいてトリガーされます
-
システムが目標品質または目標に継続的に適応する
エージェントバージョンは静的検証をセマンティックリフレクションに変換し、独自の有効性を評価する自己改善エージェントを可能にします。