Création d'architectures sans serveur pour l'IA agentic sur AWS - AWS Directives prescriptives

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'architectures sans serveur pour l'IA agentic sur AWS

Aaron Sempf, Amazon Web Services

Janvier 2026 (historique du document)

La convergence de l'IA et de l'informatique sans serveur redéfinit le paysage de l'architecture d'entreprise moderne. En réponse, les entreprises s'efforcent de fournir des capacités intelligentes à grande échelle. Ils sont confrontés à une pression croissante pour réduire les frais opérationnels, accélérer l'innovation et déployer des applications capables de s'adapter en temps réel au comportement des utilisateurs et aux événements du système.

L'activation de l'IA sans serveur AWS représente une évolution fondamentale vers des systèmes intelligents, adaptatifs et natifs du cloud. Avec la bonne stratégie et les bons outils, les entreprises peuvent accélérer les cycles d'innovation, réduire les coûts et améliorer l'évolutivité. Cette approche les place à l'avant-garde de la prochaine génération d'informatique d'entreprise. AWS permet ce changement grâce à une combinaison de services d'IA entièrement gérés et d'une infrastructure sans serveur pilotée par les événements.

Ce guide décrit les bases stratégiques et techniques sur lesquelles repose la création d'architectures sans serveur basées sur l'IA. AWS Ces architectures sont évolutives, économiques et capables de fournir des informations en temps réel sans la complexité de la gestion de l'infrastructure.

Public visé

Ce guide s'adresse aux architectes, aux développeurs et aux leaders technologiques qui cherchent à exploiter la puissance des agents logiciels pilotés par l'IA au sein d'applications cloud natives modernes.

Objectifs

Ce guide vous aide à accomplir les tâches suivantes :

  • Comprendre les services AWS natifs disponibles pour le développement de solutions d'IA agentic

  • Opérationnalisez l'IA agentique avec une fiabilité à l'échelle du cloud

  • Alignez l'exécution de l'IA sur les résultats commerciaux et les modèles de coûts

  • Établissez un cadre pour une adoption sécurisée et gouvernée de l'IA

À propos de cette série de contenus

Ce guide fait partie d'une série sur l'IA agentique sur. AWS Pour plus d'informations et pour consulter les autres guides de cette série, consultez Agentic AI sur le site Web de AWS Prescriptive Guidance.

L'analyse de rentabilisation de l'IA sans serveur

L'informatique sans serveur constitue une base idéale pour les charges de travail modernes liées à l'IA. Les applications d'IA nécessitent souvent des inférences intermittentes et gourmandes en ressources informatiques, en particulier dans des cas d'utilisation tels que la détection des fraudes, les moteurs de recommandation, la synthèse de documents et l'automatisation du service client. Les modèles d'infrastructure traditionnels peuvent être coûteux et complexes sur le plan opérationnel lorsqu'il s'agit de gérer des charges de travail imprévisibles ou complexes.

En revanche, les architectures sans serveur offrent des avantages significatifs. Ils évoluent automatiquement, s'exécutent à la demande, réduisent les frais opérationnels et ne facturent que les ressources utilisées. Ces fonctionnalités rendent les architectures sans serveur parfaitement adaptées à l'intégration de l'IA dans les applications cloud natives modernes. AWS propose un portefeuille complet de services combinant des fonctionnalités sans serveur et d'intelligence artificielle. Ces services incluent Amazon SageMaker Serverless Inference et Amazon Bedrock, qui permettent d'accéder aux modèles de base via une interface entièrement gérée basée sur des API. Amazon Bedrock AgentCore étend Amazon Bedrock au-delà de l'accès aux modèles pour proposer un environnement d'exécution complet permettant de créer, de déployer et de gérer des agents autonomes.

De plus, AWS Lambda AWS Step Functions permettez le développement de systèmes d'IA agiles, adaptés aux coûts et prêts à être mis en production. Lorsqu'ils sont associés à des services tels qu'Amazon Bedrock, SageMaker Serverless Inference AgentCore, ils fournissent des fonctionnalités intégrées de raisonnement, de mémoire et de connecteur, permettant aux développeurs de créer des agents capables de planifier, d'agir et de collaborer entre systèmes Services AWS et systèmes externes. Ces outils offrent une prise en charge puissante des charges de travail liées à l'IA, le tout dans le cadre d'une architecture sans serveur pilotée par les événements.

Les charges de travail liées à l'IA, en particulier celles liées à l'inférence, sont souvent imprévisibles et surchargées. Dans les architectures traditionnelles, cela entraîne un surprovisionnement de l'infrastructure, une augmentation des coûts et une complexité de mise à l'échelle. Les modèles sans serveur résolvent ces problèmes en proposant :

  • Évolutivité élastique — Les ressources évoluent automatiquement en fonction de la demande.

  • Optimisation des coûts — Aucuns frais pour les calculs inactifs. Payez uniquement pour le délai d'exécution.

  • Réduction des frais d'exploitation : moins d'opérations, moins de tâches à gérer et moins de dépendances à l'égard d'autres technologies, processus ou ressources.

  • Réduction des délais de commercialisation : les développeurs peuvent se concentrer sur la logique métier et les performances des modèles au lieu de se concentrer sur la gestion des serveurs.

  • Haute disponibilité et résilience intégrée : les offres AWS sans serveur fournissent ces fonctionnalités par défaut.

Grâce à ces fonctionnalités, le mode sans serveur convient parfaitement au déploiement de modèles d'IA dans de nombreux cas d'utilisation, qu'il s'agisse de la détection des fraudes, des recommandations personnalisées, de l'analyse de documents ou de l'IA conversationnelle.

Services AWS au service de l'IA sans serveur

AWS fournit une suite robuste de services gérés qui aident les équipes à intégrer l'intelligence dans les applications, à orchestrer les flux de travail et à réagir aux événements sans gérer l'infrastructure :

  • Vous pouvez AWS Lambdaainsi exécuter des charges de travail de calcul basées sur les événements à grande échelle sans avoir à provisionner de serveurs. Il est idéal pour le pré-traitement et le post-traitement de l'IA et pour la logique d'inférence légère.

  • Utilisez Amazon SageMaker Serverless Inference pour déployer des modèles d'apprentissage automatique (ML) pour des prédictions en temps réel avec mise à l'échelle automatique et sans frais d'inactivité.

  • Amazon Bedrock permet d'accéder aux modèles de base des principales entreprises d'IA telles que AI21 Labs, Anthropic, Cohere, DeepSeek, Luma AI,, MetaMistral AI, poolside(bientôt disponible), Stability AI, TwelveLabsWriter, et Amazon via une API unique pour les charges de travail génératives liées à l'IA.

  • Avec Amazon Bedrock Agents, vous pouvez créer des flux de travail pilotés par l'IA dans lesquels les modèles orchestrent les appels fonctionnels et raisonnent les tâches en utilisant le langage naturel.

  • Amazon Bedrock AgentCore fournit les fonctionnalités d'exécution, de mémoire et de connecteur de base qui simplifient la création et le dimensionnement de systèmes multi-agents. L'intégration AgentCore dans une conception sans serveur permet aux développeurs de créer des agents adaptatifs sensibles au contexte en mode natif, AWS sans avoir à gérer une orchestration personnalisée ou une gestion des états.

  • Amazon vous EventBridge permet de créer des architectures faiblement couplées et pilotées par des événements qui déclenchent automatiquement des flux de travail basés sur l'IA.

  • AWS Step FunctionsÀ utiliser pour orchestrer des pipelines d'IA en plusieurs étapes et se connecter à Services AWS l'aide de flux de travail visuels.

  • Avec AWS IoT GreengrassLambda @Edge, vous pouvez déployer des modèles et de la logique à la périphérie pour une inférence à faible latence dans l'IoT et les applications mondiales.