翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
テナント分離の強制
テナント分離は、すべてのマルチテナント設定に適用される概念です。つまり、ポリシーと戦略により、1 つのテナントが他のテナントリソースにアクセスできなくなります。マルチテナントエージェントの場合、 とエージェントのテナント分離要件を強制するのに役立つコンストラクトとメカニズムを導入する必要がある場合があります。
テナント分離の適用は、従来のマルチテナントシステムを使用する他の戦略と同様です。一般的に、AaaS アーキテクチャを構築するときは、リクエストまたはアクションがリソースにアクセスできるシステム内の任意の領域を特定し、リクエストがテナントの境界を超えているかどうかを判断します。たとえば、マイクロサービスにはテナントごとの専用 Amazon DynamoDB テーブルへの依存関係がある場合があります。そのためには、あるテナントのテーブルに別のテナントがアクセスできないようにするポリシーを導入する必要があります。
この場合、エージェントレンズによるテナント分離と、テナントごとのリソースとのやり取りを検討してください。次の図は、エージェントがテナント分離ポリシーを適用してテナントリソースへのアクセスを制御する方法の概念的な例を示しています。
この図の右側では、エージェントには個別のベクトルデータベースに保存されているテナントごとの知識があります。エージェントはリクエストを処理するときに、リクエストを行うテナントのコンテキストを調べます。これに基づいて、エージェントは適切な分離ポリシーを適用し、テナントが指定された境界外でデータまたはリソースにアクセスすることを制限できるようにします。
エージェントがモデルコンテキストプロトコル (MCP) を使用している場合は、テナント分離モデルを実装することもできます。次の図は、MCP を導入し、分離ポリシーを適用する方法の例を示しています。
MCP は、エージェントがツール、データ、リソースと統合するために使用する標準化プロトコルです。この例では、MCP クライアントと MCP サーバーは、図の右側に示されているテナント固有の知識とツールとやり取りします。テナントコンテキストはクライアントからサーバーに流れ、サーバーはこのコンテキストを使用して AWS Identity and Access Management (IAM) サービスからテナントスコープの認証情報を取得します。認証情報は、各テナントのリソースへのアクセスを制御し、あるテナントが別のテナントのリソースにアクセスできるようにします。
エージェントはマルチテナンシーを組み込むため、リクエストを処理する際にテナント分離ポリシーを適用するメカニズムを導入する必要があります。場合によっては、IAM はテナントリソースへのアクセスを制限するのに役立ちます。他のインスタンスでは、テナント分離ポリシーを適用するために、他のツールやフレームワークを導入する必要がある場合があります。
ノイズの多いネイバーとエージェント
複数のテナントがエージェントを共有するマルチテナント AaaS 環境では、ノイズの多い近隣条件を防ぐポリシーを導入する場所と方法を検討してください。ポリシーは、すべての消費に適用される汎用スロットリングを導入することも、特定のペルソナに基づいてスロットリングを適用するテナントまたは階層ベースのポリシーを導入することもできます。基本階層のテナントには、プレミアム階層のテナントよりも消費制限が厳しくなる場合があります。
このスロットリングの概念は、複数のアーキテクチャポイントに適用できます。次の図は、ノイズの多い近隣ポリシーを導入できる領域の例を示しています。
マルチエージェント実装の以前のレビューでは、エージェントが使用できるさまざまなリソースを調べ、エージェント内のテナントごとのリソースの可能性を強調しました。各タッチポイントはスロットリングポリシーを導入する可能性のある領域であり、テナントがシステムまたはテナントの階層化ポリシーの消費制限を超えないようにします。
ノイズの多い近隣保護を導入する最適な場所は、テナントがリソースを共有するアーキテクチャのポイントです。コンピューティング、メモリ、APIs、大規模言語モデルなど、これらの共有またはプールされたコンポーネントは、単一のテナントが不釣り合いに消費した場合、パフォーマンス低下の影響を受けやすくなります。
スロットリングを適用する自然な場所の 1 つは、エージェントのエントリポイントにあり、「外側エッジ」と呼ばれることもあります。ここでは、エージェントがリクエストの処理を開始する前に、グローバルレート制限またはtenant-tier-basedレート制限を導入できます。スロットリングは、エージェントが LLM を呼び出すとき、メモリにアクセスするとき、共有ツールを呼び出すときなど、実行パスのより深く適用することもできます。
これらのポリシーは、公平な使用を強制し、負荷がかかってもエージェントの耐障害性を維持し、テナント間で一貫したエクスペリエンスを維持するのに役立ちます。目標によっては、一般的なシステム保護 (耐障害性) やテナントエクスペリエンスの詳細な管理 (階層ベースの使用権限など) に重点を置くことができます。