Architecture d'agent traditionnelle : percevoir, raisonner, agir - AWS Directives prescriptives

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Architecture d'agent traditionnelle : percevoir, raisonner, agir

Le schéma suivant illustre le fonctionnement des éléments de base abordés dans la section précédente dans le cadre du cycle percevoir, raisonner et agir.

Comment les éléments de base s'appliquent à l'architecture d'agent traditionnelle.

Module Perception

Le module de perception agit comme interface sensorielle de l'agent avec le monde extérieur. Il transforme les données environnementales brutes en représentations structurées qui éclairent le raisonnement. Cela inclut la gestion de données multimodales telles que du texte, du son ou des signaux de capteurs.

  • La saisie de texte peut provenir de commandes utilisateur, de documents ou de dialogues.

  • L'entrée audio inclut des instructions vocales ou des sons environnementaux.

  • L'entrée du capteur capture des signaux du monde réel tels que le mouvement, les flux visuels ou le GPS.

Lorsque l'entrée brute a été ingérée, le processus de perception effectue une extraction des caractéristiques, suivie de la reconnaissance d'objets ou d'événements et d'une interprétation sémantique pour créer un modèle significatif de la situation actuelle. Ces résultats fournissent un contexte structuré pour la prise de décisions en aval et ancrent le raisonnement de l'agent dans des observations du monde réel.

Module Reason

Le module de raison est le cœur cognitif de l'agent. Il évalue le contexte, formule l'intention et détermine les actions appropriées. Ce module orchestre les comportements axés sur les objectifs en utilisant à la fois les connaissances apprises et le raisonnement.

Le module Reason se compose de sous-modules étroitement intégrés :

  • Mémoire : conserve l'état du dialogue, le contexte des tâches et l'historique épisodique dans des formats à court et à long terme.

  • Base de connaissances : donne accès à des règles symboliques, à des ontologies ou à des modèles appris (tels que des intégrations, des faits et des politiques).

  • Objectifs et plans : définit les résultats souhaités et élabore des stratégies d'action pour les atteindre. Les objectifs peuvent être mis à jour de manière dynamique et les plans peuvent être modifiés de manière adaptative en fonction des commentaires.

  • Prise de décision : agit en tant que moteur d'arbitrage central en évaluant les options, en évaluant les compromis et en sélectionnant l'action suivante. Ce sous-module prend en compte les seuils de confiance, l'alignement des objectifs et les contraintes contextuelles.

Ensemble, ces composants permettent à l'agent de raisonner sur son environnement, de mettre à jour ses croyances, de sélectionner des voies et de se comporter de manière cohérente et adaptative. Le module Reason comble le fossé entre la perception et le comportement.

Module Act

Le module act exécute la décision sélectionnée par l'agent en s'interfaçant avec l'environnement numérique ou physique pour effectuer les tâches. C'est là que l'intention devient action.

Ce module comprend trois canaux fonctionnels :

  • Actionneurs : pour les agents présents physiquement (tels que les robots et les appareils IoT), ils contrôlent les interactions au niveau du matériel telles que le mouvement, la manipulation ou la signalisation.

  • Exécution : gère les actions basées sur le logiciel, notamment l'invocation APIs, l'envoi de commandes et la mise à jour des systèmes.

  • Outils : active des fonctionnalités telles que la recherche, la synthèse, l'exécution de code, le calcul et la gestion de documents. Ces outils sont souvent dynamiques et sensibles au contexte, ce qui accroît l'utilité de l'agent.

Les sorties du module act sont renvoyées dans l'environnement et bouclent la boucle. Ces résultats sont à nouveau perçus par l'agent. Ils mettent à jour l'état interne de l'agent et éclairent les décisions futures, complétant ainsi le cycle de perception, de raisonnement et d'action.