並列化パターンと散布図パターン - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

並列化パターンと散布図パターン

大きなドキュメントの要約、複数のソリューションパスの評価、多様な視点の比較など、多くの高度な推論および生成タスクは、プロンプトの並列実行からメリットを得ます。スケーラビリティ、応答性、耐障害性が必要な場合、従来のシーケンシャルワークフローは短くなります。これを克服するために、LLM ベースの並列化は、タスクが自律エージェントに動的にファンアウトされ、結果がインテリジェントに合成されるイベント駆動型の散布図パターンを使用して再考できます。

次の図は、LLM 並列化ワークフローの例です。

LLM 並列化。

Scatter-gather

分散システムでは、散布図パターンはタスクを複数のサービスまたは処理ユニットに並行して送信し、応答を待機してから、結果を統合出力に集約します。ファンアウトとは異なり、scatter-gather はレスポンスを想定し、通常は結果を結合、比較、選択するロジックを適用するため、調整されます。

並列化と散布収集の一般的な実装は次のとおりです。

  • AWS Step Functions 並列タスク実行の状態をマッピングする

  • AWS Lambda 同時実行で、複数の呼び出し関数の結果を調整する

  • 相関 IDsと集約ワークフローを備えた Amazon EventBridge

  • Amazon Simple Storage Service (Amazon S3)、Amazon DynamoDB、またはキューを使用してファンアウトを管理し、結果を収集するカスタムコントローラーパターン

次の図は、散布図の例です。

Scatter-gather。
  1. ユーザーは、Amazon Simple Notification Service (Amazon SNS) トピックに並列メッセージを発行することでタスクを分散する中央コーディネーター関数にリクエストを送信します。

  2. 各メッセージにはタスクメタデータが含まれ、特殊なワーカー にルーティングされます AWS Lambda。

  3. 各ワーカーは、割り当てられたサブタスクを AWS Lambda 個別に処理します (外部 API のクエリ、ドキュメントの処理、データの分析など)。

  4. 結果は、Amazon Simple Queue Service (Amazon SQS) などの一般的なストレージレイヤーに書き込まれます。

  5. アグリゲータ関数は、すべてのレスポンスが完了するまで待機し、以下を実行します。

    • 結果を収集して集計します (概要のマージ、最適な一致の選択など)

    • 最終レスポンスを送信するか、ダウンストリームワークフローをトリガーします

散布物収集パターンの一般的なユースケースは次のとおりです。

  • フェデレーティッド検索

  • 価格比較エンジン

  • 集計データ分析

  • マルチモデル推論

LLM ベースの並列化 (散布図認識)

エージェントシステムでは、並列化は、複数の LLM コールまたはエージェントにサブタスクを分散することで散布図を密接にミラーリングし、それぞれが問題の一部を個別に推論します。返される結果は集約プロセスによって収集および合成されます。集約プロセスは、多くの場合、別の LLM エージェントまたはコントローラーエージェントです。

エージェント並列化

  1. エージェントは、「これら 10 件のレポート全体でインサイトを要約する」リクエストを送信します。

  2. レポートは 10 個の並列 LLM 要約タスクに分散されます。

  3. すべての概要を返すと、エージェントは以下を実行します。

    • 概要を統一された説明に集約します

    • テーマまたは矛盾を特定する

    • 合成された出力をユーザーに送信します

このエージェントワークフローにより、スケーラブル、モジュール式、適応型の並列推論が可能になります。これは、高い認知スループットを必要とするユースケースに最適です。

次の図は、エージェントの並列化の例です。

エージェント並列化。
  1. ユーザーがマルチパートクエリまたはドキュメントセットを送信します。

  2. コントローラー AWS Lambda またはステップ関数は、サブタスクを分散します。各タスクは、独自のプロンプトを使用して Amazon Bedrock LLM コールまたはサブエージェントを呼び出します。

  3. 呼び出しとサブタスクが完了すると、結果が保存され (Amazon S3 やメモリストアなど)、集計ステップが出力をマージ、比較、またはフィルタリングします。

  4. システムは、ユーザーまたはダウンストリームエージェントに最終レスポンスを返します。

このシステムには、トレーサビリティ、耐障害性、オプションの結果の重み付けまたは選択ロジックを備えた分散推論ループがあります。

重要事項

エージェント並列化は、散乱集合パターンを使用して LLM タスクを分散し、並列処理とインテリジェントな結果合成を可能にします。