Stratégies du Model Context Protocol sur AWS

Amazon Web Services (contributeurs)

Mars 2026 (historique du document)

Ce guide peut vous aider à développer et à mettre en œuvre des stratégies MCP (Model Context Protocol) au sein de votre organisation afin de soutenir votre parcours vers l'IA agentique. Alors que les agents et les modèles linguistiques occupent une place de plus en plus centrale dans les opérations commerciales, la mise en place d'une stratégie MCP est essentielle au succès des solutions agentiques.

Ce guide explore trois piliers fondamentaux pour élaborer une stratégie MCP : la conception d'outils MCP, l'hébergement de serveurs MCP et la gouvernance MCP. En prenant en compte ces composants interconnectés, les entreprises peuvent créer des systèmes évolutifs, sécurisés et efficaces pour gérer le contexte des modèles dans le cadre de leurs implémentations d'IA. Ce guide fournit des informations exploitables et des conseils stratégiques aux organisations à toutes les étapes de leur parcours en matière d'IA, de l'expérimentation initiale aux déploiements de production à grande échelle. Cela les aide à développer des solutions MCP sur mesure qui répondent à leurs besoins et objectifs spécifiques.

Ces meilleures pratiques sont issues de mises en œuvre réelles d'organisations déployant le MCP à l'échelle de l'entreprise, d'une analyse des normes de spécification MCP actuelles et des leçons tirées des applications personnalisées de modèles de langage large (LLM) en production.

Les systèmes d'IA sont de plus en plus sophistiqués et robustes LLMs dans une grande variété de cas d'utilisation. LLMs excellent à comprendre le langage naturel, à générer des réponses semblables à celles des humains et à raisonner sur des informations complexes. Cependant, pour passer LLMs des interfaces conversationnelles à des systèmes capables d'accomplir des tâches complexes de manière autonome, les entreprises adoptent des architectures d'IA agentiques, des systèmes d'IA capables de percevoir leur environnement, de raisonner sur les objectifs, de prendre des décisions autonomes, d'orchestrer en plusieurs étapes et de prendre des mesures pour atteindre les objectifs au nom des utilisateurs. Cette approche agentique aide les entreprises à créer des systèmes d'IA capables de comprendre les intentions des utilisateurs grâce au langage naturel, de coordonner de manière autonome plusieurs sources de données et outils, et de proposer des expériences personnalisées à une échelle impossible avec les modèles traditionnels de demande-réponse. Pour renforcer les capacités de ces agents, les entreprises doivent fournir un accès à leurs outils et données existants afin d'enrichir la compréhension contextuelle de l'agent et de lui permettre d'agir au nom de l'utilisateur.

MCP fournit un protocole standardisé pour l'intégration des outils d'intelligence artificielle, permettant une communication cohérente entre les agents et les ressources externes. Bien que MCP définisse lui-même la norme de communication, sa mise en œuvre efficace nécessite un examen attentif des modèles architecturaux, des modèles de sécurité, des pratiques opérationnelles et des stratégies d'optimisation des performances pour obtenir des solutions évolutives, sécurisées et maintenables.

Ce guide synthétise les leçons tirées des déploiements MCP en entreprise, en fournissant des recommandations pratiques conformes au Well-Architected Framework.AWS Il couvre les stratégies de conception d'outils MCP, d'hébergement de serveurs MCP et de gouvernance MCP, qui sont essentielles pour créer vos propres solutions MCP. Les recommandations de ce guide correspondent aux cinq piliers suivants du AWS Well-Architected Framework :

Sécurité : isolation par jeton, informations d'identification limitées, autorisation séparée read/write
Excellence opérationnelle — Sélection d'outils, mesures de précision, ensembles de données de référence pour les tests de régression
Fiabilité : limitation du débit par utilisateur et par outil, délestage
Efficacité des performances : outils adaptés au flux de travail, filtrage des outils, recherche sémantique pour réduire l'utilisation des fenêtres contextuelles
Optimisation des coûts : serveurs MCP réutilisables au sein des équipes, réduction des coûts de jetons par demande grâce au filtrage des outils

Public visé

Ce guide est destiné aux architectes, aux développeurs et aux leaders technologiques qui mettent en œuvre des solutions d'IA agentic dans leurs organisations. Pour comprendre les concepts présentés dans ce guide, vous devez comprendre leur LLMs fonctionnement et avoir des connaissances de base sur le MCP, les outils et l'ingénierie rapide.

Objectifs

Pour créer des systèmes d'IA Agentic prêts pour la production, il faut résoudre ensemble les questions de gouvernance, d'optimisation et de sécurité afin de soutenir les politiques de votre organisation. Ce qui suit explique comment ce guide répond à ces objectifs :

Gouvernance — Sans gouvernance centralisée, vous ne pouvez pas répondre aux questions d'audit concernant vos charges de travail liées à l'IA, notamment savoir quels agents ont accédé à quelles données, avec quelles autorisations et quand. Vous ne pouvez pas non plus appliquer le versionnement. La section de ce guide consacrée à la stratégie d'hébergement MCP explique comment les utilisateurs peuvent utiliser des serveurs MCP locaux obsolètes présentant des vulnérabilités connues en raison de l'absence de mesures d'application systématiques.

Pour les industries réglementées, la gouvernance est essentielle. Les auditeurs souhaitent voir l'application des politiques et le suivi de l'utilisation des outils par tous les agents à partir d'un seul volet. C'est ce que permet la gouvernance du MCP.

En suivant les recommandations de ce guide, vous pouvez améliorer la précision des tâches de 28 à 32 % dans les benchmarks évalués par des pairs. Pour plus d'informations, consultez MARCO : Multi-Agent Real-Time Chat Orchestration (site web de l'ACL Anthology). La gouvernance ne se limite pas à la conformité ; elle améliore également les performances de votre système d'IA agentic.
Optimisation — Vos équipes peuvent créer les mêmes intégrations plusieurs fois. Par exemple, lorsque cinq équipes différentes écrivent leur propre script de requête de base de données pour que leur application d'IA communique avec leurs bases de données, cela représente cinq fois le coût de développement et cinq ensembles de listes de bogues à gérer. MCP vous permet de le créer une seule fois et de le partager avec l'ensemble de la communauté des ingénieurs. Les économies s'accumulent à mesure que le nombre de vos agents augmente.

Il existe également un problème de coût par demande que la plupart des équipes ne remarquent pas au début. Chaque définition d'outil consomme des jetons de fenêtre contextuelle. Avec 20 outils, vous dépensez 5 000 à 10 000 jetons par invocation uniquement pour les descriptions, ainsi que pour les demandes des utilisateurs. Cela augmente la latence et les coûts d'inférence LLM et dégrade la précision, car le modèle peine à choisir le bon outil dans la liste des outils disponibles.

Les agents qui utilisent des wrappers d'outils structurés sont environ trois fois plus précis dans les tâches de base de données que les agents qui y accèdent APIs directement (pour plus d'informations, voir Middleware for LLMs : Les outils sont essentiels pour les agents linguistiques dans les environnements complexes). La façon dont vous concevez et présentez les outils dans un modèle d'IA est importante. Ce guide recommande de donner aux outils des schémas clairs, de les adapter aux flux de travail réels plutôt qu'aux points de terminaison bruts et de limiter les informations dans la fenêtre contextuelle. La section de ce guide consacrée à la stratégie de conception des outils MCP analyse en profondeur ces aspects.
Sécurité et conformité — Imaginez un système d'IA agentique qui hallucine une étape de nettoyage et tente de supprimer une base de données de production. Si l'agent a hérité des informations d'identification complètes de l'administrateur de l'utilisateur, la suppression peut être effectuée. Grâce à l'isolation par jeton et à des informations d'identification limitées qui n'accordent qu'un accès en lecture et en création, il échoue en toute sécurité.

Les flux de travail régulés renforcent encore ce point. Le guide fournit des exemples (pipelines de soins de santé qui nécessitent la validation HIPAA et l'anonymisation des informations personnellement identifiables avant de traiter les données des patients). L'intégration d'une telle logique dans les outils MCP signifie que la conformité se fait de manière déterministe à chaque fois.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Qu'est-ce que le MCP ?