View a markdown version of this page

でのモデルコンテキストプロトコル戦略 AWS - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

でのモデルコンテキストプロトコル戦略 AWS

Amazon Web Services (寄稿者)

2026 年 3 月 (ドキュメント履歴)

このガイドは、エージェント AI ジャーニーをサポートするために、組織全体でモデルコンテキストプロトコル (MCP) 戦略を開発および実装するのに役立ちます。エージェントと言語モデルがビジネスオペレーションの中心になるにつれて、エージェントソリューションを成功させるには MCP 戦略を確立することが重要です。

このガイドでは、MCP 戦略を構築するための 3 つの基本的な柱である MCP ツール設計、MCP サーバーホスティング、および MCP ガバナンスについて説明します。これらの相互接続されたコンポーネントに対処することで、組織は AI 実装全体でモデルコンテキストを管理するためのスケーラブルで安全で効果的なシステムを作成できます。このガイダンスは、最初の実験からフルスケールの本番デプロイまで、組織の AI ジャーニーのあらゆる段階で、組織に実用的なインサイトと戦略的ガイダンスを提供します。これにより、特定のニーズや目的に合ったカスタマイズされた MCP ソリューションを開発できます。

これらのベストプラクティスは、企業規模で MCP をデプロイする組織の実際の実装、現在の MCP 仕様標準の分析、本番環境のカスタム大規模言語モデル (LLM) アプリケーションから学んだ教訓に基づいています。

AI システムは、さまざまなユースケースでますます洗練され、堅牢な LLMs を使用します。LLMs、自然言語の理解、人間のようなレスポンスの生成、複雑な情報に対する推論に優れています。ただし、LLMs を会話型インターフェイスから複雑なタスクを自律的に実行できるシステムに変換するために、組織は エージェント AI アーキテクチャ、環境を認識できる AI システム、目標の理由、自律的な意思決定を行い、複数のステップにわたって調整し、ユーザーに代わって目標を達成するためのアクションを実行しています。このエージェント的アプローチは、組織が自然言語を通じてユーザーのインテントを理解し、複数のデータソースとツール間で自律的に調整し、従来のリクエスト/レスポンスパターンでは不可能な規模でパーソナライズされたエクスペリエンスを提供できる AI システムを構築するのに役立ちます。これらのエージェントをより有能にするには、組織は既存のツールとデータへのアクセスを提供して、エージェントのコンテキスト理解を強化し、ユーザーに代わって行動できるようにする必要があります。

MCP は AI ツール統合の標準化プロトコルを提供し、エージェントと外部リソース間の一貫した通信を可能にします。MCP 自体が通信標準を定義していますが、効果的に実装するには、スケーラブル、安全、保守可能なソリューションを実現するために、アーキテクチャパターン、セキュリティモデル、運用プラクティス、パフォーマンス最適化戦略を慎重に検討する必要があります。

このガイドでは、エンタープライズ MCP デプロイから学んだ教訓を合成し、 AWS Well-Architected フレームワークに沿った実用的な推奨事項を提供します。独自の MCP ソリューションの構築に不可欠な MCP ツール設計、MCP サーバーホスティング、および MCP ガバナンスの戦略について説明します。このガイドの推奨事項は、 AWS Well-Architected フレームワークの次の 5 つの柱にマッピングされています。

  • セキュリティ – トークンの分離、スコープダウンされた認証情報、個別の読み取り/書き込み認可

  • 運用上の優秀性 – ツール選択精度メトリクス、回帰テスト用のゴールデンデータセット

  • 信頼性 – ユーザーごとおよびツールごとのレート制限、負荷削減

  • パフォーマンス効率 – ワークフロースコープのツール、ツールフィルタリング、コンテキストウィンドウの使用量を減らすセマンティック検索

  • コスト最適化 – チーム間で再利用可能な MCP サーバー、ツールフィルタリングによるリクエストごとのトークンコストを削減

対象者

このガイドは、組織にエージェント AI ソリューションを実装しているアーキテクト、デベロッパー、テクノロジーリーダーを対象としています。このガイドの概念を理解するには、LLMs の仕組みを理解し、MCP、ツール、プロンプトエンジニアリングに関する基本的な知識を持っている必要があります。

目的

本番環境に対応した エージェント AI システムを構築するということは、ガバナンス、最適化、セキュリティをまとめて解決し、組織のポリシーをサポートすることを意味します。以下に、このガイドがこれらの目的にどのように対処するかを説明します。

  • ガバナンス – 一元化されたガバナンスがない場合、どのエージェントがどのデータにアクセスしたか、どのアクセス許可を持つか、いつアクセスしたかなど、AI ワークロードに関する監査の質問に回答することはできません。また、バージョニングを適用することもできません。このガイドの MCP ホスティング戦略セクションでは、体系的な適用がないために、既知の脆弱性を持つ古いローカル MCP サーバーをユーザーが実行する方法について説明します。

    規制された業界にとって、ガバナンスは重要です。監査者は、すべてのエージェントでポリシーの適用とツールの使用状況の追跡を 1 つのペインから確認したいと考えています。MCP ガバナンスはこれを提供します。

    このガイドの推奨事項に従うことで、ピアレビュー済みのベンチマークでタスクの精度を 28~32% 向上させることができます。詳細については、「MARCO: Multi-Agent Real-time Chat Orchestration」(ACL Anthology ウェブサイト) を参照してください。ガバナンスはコンプライアンスだけでなく、エージェント AI システムのパフォーマンスも向上します。

  • 最適化 – チームは同じ統合を複数回構築する場合があります。例えば、5 つの異なるチームが AI アプリケーションがデータベースと通信するための独自のデータベースクエリスクリプトを記述すると、開発コストの 5 倍、維持するバグリストの 5 セットになります。MCP を使用すると、一度構築し、エンジニアリングコミュニティ全体で共有できます。エージェント数が増えるにつれて節約が複雑になります。

    また、ほとんどのチームが最初に気付かないリクエストごとのコスト問題もあります。すべてのツール定義はコンテキストウィンドウトークンを消費します。20 のツールでは、ユーザーの問い合わせとともに、説明のみに呼び出しごとに 5,000~10,000 トークンを費やしています。これにより、モデルが利用可能なツールのリストから適切なツールを選択するのに苦労するため、レイテンシーと LLM 推論コストが増加し、精度が低下します。

    構造化ツールラッパーを使用するエージェントは、APIs に直接アクセスするエージェントよりもデータベースタスクの精度が約 3 倍高くなります (詳細については、「Middleware for LLMs: Tools Are Instrumental for Language Agents in Complex Environments」を参照してください)。AI モデルにツールを設計して提示する方法は重要です。このガイドでは、ツールに明確なスキーマを付与し、未加工のエンドポイントではなく実際のワークフローにスコープし、コンテキストウィンドウで情報を制限することを推奨しています。このガイドの MCP ツール設計戦略セクションでは、これらの側面について詳しく説明します。

  • セキュリティとコンプライアンス – クリーンアップステップをハルシネーションし、本番稼働用データベースを削除しようとするエージェント AI システムを想像してみてください。エージェントがユーザーの完全な管理者認証情報を継承した場合、削除が実行される可能性があります。読み取りアクセスと作成アクセスのみを許可するトークン分離とスコープダウンされた認証情報では、安全に失敗します。

    規制されたワークフローは、これをさらにシャープにします。このガイドでは、例 (患者データを処理する前に HIPAA 検証と個人を特定できる情報の匿名化を必要とする医療パイプライン) を示します。このようなロジックを MCP ツールに埋め込むと、コンプライアンスは毎回決定的に行われます。