Architecture axée sur les événements : l'épine dorsale de l'IA sans serveur - AWS Directives prescriptives

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Architecture axée sur les événements : l'épine dorsale de l'IA sans serveur

L'IA sans serveur AWS est basée sur l'architecture pilotée par les événements (EDA), un style architectural dans lequel les événements constituent le principal mécanisme d'intégration et de contrôle. Un événement est un changement d'état ou un événement notable au sein d'un système, tel qu'un téléchargement de fichier, une demande utilisateur, un signal de capteur ou un résultat d'inférence de modèle. Les événements servent de déclencheurs, amenant les services ou agents en aval à réagir sans couplage étroit entre les composants.

Dans l'EDA, plutôt que d'invoquer directement des services ou de demander des modifications, les systèmes répondent aux événements de manière asynchrone et en temps réel. Cette approche crée des applications hautement découplées, évolutives et réactives.

Pourquoi l'EDA est importante pour les systèmes d'IA

L'EDA offre les avantages importants suivants pour les systèmes d'IA :

  • Conception de système découplée : les producteurs d'événements (par exemple, Amazon S3 et Amazon API Gateway) n'ont pas besoin de connaître les consommateurs (par exemple, AWS Lambda Amazon Bedrock et). AWS Step Functions Ce découplage permet une itération rapide, une mise à l'échelle indépendante et un risque minimal de défaillances en cascade. Dans un système d'IA, le service de collecte de données n'a pas besoin de savoir quel modèle est exécuté ni comment les réponses sont traitées. Le service émet simplement un événement.

  • Intégration fluide des flux de travail liés à l'IA — L'EDA permet aux fonctions d'IA, telles que le prétraitement, l'inférence, la mise à la base, la synthèse ou la prise d'actions, de devenir des services modulaires déclenchés par des événements. Ces services peuvent évoluer indépendamment et évoluer sans logique de coordination centralisée.

  • Mise à l'échelle élastique et axée sur les événements : les charges de travail liées à l'IA sont souvent surchargées. L'EDA peut éliminer les ressources inutilisées et améliorer la rentabilité grâce aux fonctionnalités de mise à l'échelle suivantes :

    • AWS Lambda redimensionne automatiquement en fonction du volume des événements.

    • Les opérations de l'API Amazon Bedrock peuvent être appelées à partir des fonctions Lambda en réponse à des événements déclencheurs.

    • AWS Step Functions peut coordonner des pipelines en plusieurs étapes uniquement lorsque cela est nécessaire.

  • Prise de décision en temps réel — Les événements permettent aux services d'intelligence artificielle de réagir immédiatement aux entrées du système ou de l'utilisateur, comme le montrent les exemples suivants :

    • Un message de chatbot déclenche un agent Amazon Bedrock.

    • Un événement de transaction déclenche un modèle de détection des fraudes.

    • Le téléchargement d'un document déclenche un pipeline de synthèse.

L'EDA et le modèle d'agent logiciel

L'EDA ne se limite pas au découplage. L'EDA s'aligne sur le paradigme des agents logiciels, selon lequel les agents autonomes perçoivent les événements, raisonnent à leur sujet et agissent sur leur environnement.

Dans les systèmes d'IA agentique, les événements sont perçus comme des observations, déclenchant des boucles cognitives liées à la définition d'objectifs, à la planification et à l'action. L'EDA fournit le substrat pour l'interaction agent-environnement :

Les services sans serveur tels que Lambda et Amazon Bedrock étant par nature apatrides EventBridge, réactifs et à la demande, ils constituent l'infrastructure idéale pour les architectures d'intelligence artificielle agentique.

Services AWS soutien à l'EDA

L'architecture axée sur les événements est le substrat conjonctif des systèmes d'IA modernes. Il permet des flux de travail asynchrones, réactifs et hautement découplés qui évoluent de manière élastique et répondent en temps réel. L'EDA sert de base opérationnelle aux modèles d'agents logiciels, ce qui en fait la solution architecturale naturelle pour l'IA agentique dans les environnements sans serveur.

L'architecture basée sur les événements Services AWS prise en charge suivante est la suivante :

  • Amazon EventBridge fournit des fonctionnalités de routage des événements et de gestion des schémas.

  • La fonctionnalité Amazon S3 Event Notifications déclenche des flux d'IA lorsque des fichiers ou des objets sont mis à jour.

  • AWS Lambdaexécute la logique en réponse aux événements.

  • Amazon SNS et Amazon SQS gèrent la messagerie pub/sub et la mise en mémoire tampon des messages.

  • AWS Step Functionsorchestre les flux de travail d'IA lors de la réception d'événements.

  • Amazon Kinesis Data Streams permet l'ingestion et le traitement en temps réel de données de streaming à haut débit.

  • Amazon API Gateway (webhooks et déclencheurs d'événements) peut recevoir et transformer des événements externes via REST ou WebSocket les publier EventBridge sur Lambda.

  • AWS AppSyncAbonnements GraphQL pour GraphQL en temps réel piloté par les événements. APIs

  • Amazon Bedrock Agents fournit une orchestration agentique déclenchée par des objectifs ou des événements.

  • Amazon Bedrock AgentCore :

    • AgentCore Runtime : environnement d'exécution pour l'hébergement et l'exécution de la logique des agents. S'intègre à AWS Lambda Amazon Elastic Container Service (Amazon ECS) pour plus d'élasticité et évolue de manière autonome en fonction des déclencheurs d'événements.

    • AgentCore Mémoire : fournit une mémoire persistante pour stocker le contexte de la conversation, les résultats des tâches et l'état spécifique à l'agent. Peut compléter ou remplacer Amazon DynamoDB selon certains modèles, en fonction des exigences de latence et de taille.

    • AgentCore Passerelle : permet aux agents d'invoquer des sources de données externes APIs via des intégrations gérées, réduisant ainsi le code de connecteur personnalisé et améliorant l'observabilité. Services AWS

    • AgentCore outils intégrés : fournit des fonctionnalités d'exécution de code et de navigation sur le Web au sein AgentCore des environnements.