View a markdown version of this page

对上下文协议策略进行建模 AWS - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

对上下文协议策略进行建模 AWS

Amazon Web Services贡献者

2026 年 3 月文件历史记录

本指南可以帮助您在整个组织中制定和实施模型上下文协议 (MCP) 策略,以支持您的代理人工智能之旅。随着代理和语言模型在业务运营中越来越重要,建立 MCP 策略对于成功的代理解决方案至关重要。

本指南探讨了构建 MCP 策略的三个基本支柱:MCP 工具设计、MCP 服务器托管和 MCP 治理。通过解决这些相互关联的组件,组织可以创建可扩展、安全和有效的系统,用于管理其人工智能实施中的模型上下文。该指南为处于组织人工智能之旅任何阶段(从初始实验到全面生产部署)的组织提供了切实可行的见解和战略指导。这有助于他们开发符合其特定需求和目标的量身定制的 MCP 解决方案。

这些最佳实践源自企业规模部署 MCP 的组织的实际实施情况、对当前 MCP 规范标准的分析,以及从生产中的自定义大型语言模型 (LLM) 应用程序中吸取的经验教训。

人工智能系统在各种各样的用例 LLMs 中使用越来越复杂和强大。 LLMs 擅长理解自然语言、生成类似人类的反应以及对复杂信息进行推理。但是,为了 LLMs 从对话界面转变为可以自主完成复杂任务的系统,组织正在采用代理人工智能架构,即可以感知环境、推理目标、做出自主决策、跨多个步骤协调以及采取行动代表用户实现目标的人工智能系统。这种代理方法可以帮助组织构建人工智能系统,该系统可以通过自然语言理解用户意图,在多个数据源和工具之间进行自主协调,并以传统请求-响应模式无法实现的规模提供个性化体验。为了提高这些代理的能力,组织需要提供对其现有工具和数据的访问权限,以丰富代理对情境的理解,并允许其代表用户采取行动。

MCP 为 AI 工具集成提供了标准化协议,可实现代理和外部资源之间的一致通信。虽然 MCP 本身定义了通信标准,但有效实施该标准需要仔细考虑架构模式、安全模型、运营实践和性能优化策略,以实现可扩展、安全和可维护的解决方案。

本指南综合了从企业 MCP 部署中吸取的经验教训,提供了与 Well-Architected Framework 一致的可行建议。AWS它涵盖了 MCP 工具设计、MCP 服务器托管和 MCP 治理的策略,这些策略对于构建自己的 MCP 解决方案至关重要。本指南中的建议对应于 Well-Architecte AWS d 框架的以下五个支柱:

  • 安全性-令牌隔离、限定范围的凭证、单独的授权 read/write

  • 卓越运营 — 工具选择精度指标,用于回归测试的黄金数据集

  • 可靠性 — 每个用户和每个工具的速率限制、减载

  • 性能效率 — 工作流范围的工具、工具筛选、语义搜索以减少上下文窗口的使用

  • 成本优化 — 跨团队可重复使用的 MCP 服务器,通过工具筛选降低每个请求的代币成本

目标受众

本指南适用于在其组织中实施代理人工智能解决方案的架构师、开发人员和技术领导者。要理解本指南中的概念,您应该了解 MCP、工具和即时 LLMs 工程的基础知识。

目标

构建可随时投入生产的 Agentic AI 系统意味着同时解决治理、优化和安全问题,以支持组织的政策。以下内容解释了本指南如何实现这些目标:

  • 治理 — 如果没有集中式治理,您就无法回答有关您的 AI 工作负载的审计问题,包括哪些代理访问了哪些数据、使用什么权限以及何时访问了哪些数据。您也不能强制执行版本控制。本指南的 MCP 托管策略部分解释了由于缺乏系统强制措施,用户如何运行存在已知漏洞的过时本地 MCP 服务器。

    对于受监管的行业,治理至关重要。审计员希望通过一个窗格查看所有代理的策略实施和工具使用情况跟踪。MCP 治理提供了这一点。

    通过遵循本指南中的建议,您可以在同行评审的基准测试中将任务准确性提高 28-32%。有关更多信息,请参阅 MARCO:多代理实时聊天编排(ACL Anthology 网站)。治理不仅仅是合规性;它还可以提高代理人工智能系统的性能。

  • 优化-您的团队可能会多次构建相同的集成。例如,当五个不同的团队为他们的 AI 应用程序编写自己的数据库查询脚本以与其数据库通信时,这相当于开发成本的五倍,需要维护五组错误清单。MCP 允许您一次构建,然后在整个工程社区中共享。随着代理人数的增长,节省的资金会增加。

    还有一个按请求计费的问题,大多数团队一开始都没有注意到。每个工具定义都消耗上下文窗口标记。在 20 个工具中,你每次调用仅在描述和用户查询上就花费了 5,000-10,000 个代币。这会增加延迟和 LLM 推理成本,并降低准确性,因为模型难以从可用工具列表中选择正确的工具。

    使用结构化工具包装器的代理在数据库任务上的准确性大约是 APIs 直接访问的代理的三倍(有关更多信息,请参阅中间件 LLMs:工具对于复杂环境中的语言代理非常有用)。如何为 AI 模型设计和呈现工具非常重要。本指南建议为工具提供清晰的架构,将其范围限定为实际工作流程而不是原始端点,并限制上下文窗口中的信息。本指南的 MCP 工具设计策略部分深入探讨了这些方面。

  • 安全性与合规性 — 想象一下一个代理人工智能系统,它会产生清理步骤的幻觉并尝试删除生产数据库。如果代理继承了用户的完整管理员凭据,则删除操作可能会通过。由于令牌隔离和仅授予读取和创建访问权限的范围缩小凭证,它可以安全地失败。

    受监管的工作流程进一步强化了这一点。该指南提供了示例(在处理患者数据之前需要HIPAA验证和匿名化个人身份信息的医疗保健渠道)。在 MCP 工具中嵌入这样的逻辑意味着每次都能确定地实现合规性。