Éléments de base des agents logiciels - AWS Directives prescriptives

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Éléments de base des agents logiciels

Le schéma suivant présente les principaux modules fonctionnels présents dans la plupart des agents intelligents. Chaque composant contribue à la capacité de l'agent à fonctionner de manière autonome dans des environnements complexes.

Modules et sous-modules fonctionnels clés des agents intelligents.

Dans le contexte de la boucle de perception, de raison et d'action, la capacité de raisonnement d'un agent est répartie entre ses modules cognitifs et d'apprentissage. Grâce à l'intégration de la mémoire et de l'apprentissage, l'agent développe un raisonnement adaptatif fondé sur l'expérience passée. Lorsque l'agent agit dans son environnement, il crée une boucle de rétroaction émergente : chaque action influence les perceptions futures, et l'expérience qui en résulte est incorporée dans la mémoire et les modèles internes par le biais du module d'apprentissage. Cette boucle continue de perception, de raisonnement et d'action permet à l'agent de s'améliorer au fil du temps et complète le cycle complet de perception, de raison et d'action.

Module de perception

Le module de perception permet à l'agent d'interagir avec son environnement par le biais de diverses modalités de saisie telles que le texte, le son et les capteurs. Ces entrées constituent les données brutes sur lesquelles reposent tous les raisonnements et actions. Les entrées de texte peuvent inclure des instructions en langage naturel, des commandes structurées ou des documents. Les entrées audio incluent des instructions vocales ou des sons environnementaux. Les entrées des capteurs incluent des données physiques telles que des flux visuels, des signaux de mouvement ou des coordonnées GPS. La fonction principale de la perception est d'extraire des caractéristiques et des représentations significatives de ces données brutes. Cela permet à l'agent de construire une compréhension précise et exploitable de son contexte actuel. Le processus peut impliquer l'extraction de caractéristiques, la reconnaissance d'objets ou d'événements et l'interprétation sémantique, et constitue la première étape critique de la boucle de perception, de raison et d'action. Une perception efficace garantit que le raisonnement et la prise de décisions en aval sont fondés sur une connaissance pertinente de up-to-date la situation.

Module cognitif

Le module cognitif sert de noyau délibératif à l'agent logiciel. Il est chargé d'interpréter les perceptions, de former l'intention et de guider un comportement déterminé grâce à une planification et à une prise de décision axées sur les objectifs. Ce module transforme les entrées en processus de raisonnement structurés, ce qui permet à l'agent d'agir intentionnellement plutôt que de manière réactive. Ces processus sont gérés par le biais de trois sous-modules clés : objectifs, planification et prise de décision.

Sous-module Objectifs

Le sous-module des objectifs définit l'intention et la direction de l'agent. Les objectifs peuvent être explicites (par exemple, « naviguer vers un emplacement » ou « soumettre un rapport ») ou implicites (par exemple, « maximiser l'engagement des utilisateurs » ou « minimiser le temps de latence »). Ils sont au cœur du cycle de raisonnement de l'agent et fournissent un état cible pour sa planification et ses décisions.

L'agent évalue en permanence les progrès réalisés par rapport à ses objectifs et peut redéfinir les priorités ou régénérer les objectifs en fonction de nouvelles perceptions ou de nouveaux apprentissages. Cette connaissance des objectifs permet à l'agent de s'adapter aux environnements dynamiques.

Sous-module de planification

Le sous-module de planification élabore des stratégies pour atteindre les objectifs actuels de l'agent. Il génère des séquences d'actions, décompose les tâches de manière hiérarchique et sélectionne des plans prédéfinis ou générés dynamiquement.

Pour fonctionner efficacement dans des environnements non déterministes ou changeants, la planification n'est pas statique. Les agents modernes peuvent générer des chain-of-thought séquences, introduire des sous-objectifs en tant qu'étapes intermédiaires et réviser les plans en temps réel lorsque les conditions changent.

Ce sous-module est étroitement lié à la mémoire et à l'apprentissage, et permet à l'agent d'affiner sa planification au fil du temps en fonction des résultats antérieurs.

Sous-module de prise de décision

Le sous-module de prise de décision évalue les plans et les actions disponibles afin de sélectionner l'étape suivante la plus appropriée. Il intègre les informations issues de la perception, du plan actuel, des objectifs de l'agent et du contexte environnemental.

La prise de décision tient compte de :

  • Compromis entre des objectifs contradictoires

  • Seuils de confiance (par exemple, incertitude de perception)

  • Conséquences des actions

  • L'expérience acquise par l'agent

Selon l'architecture, les agents peuvent s'appuyer sur le raisonnement symbolique, l'heuristique, l'apprentissage par renforcement ou les modèles linguistiques (LLMs) pour prendre des décisions éclairées. Ce processus garantit que le comportement de l'agent reste adapté au contexte, aligné sur les objectifs et adaptatif.

Module d'action

Le module d'action est chargé d'exécuter les décisions sélectionnées par l'agent et de s'interfacer avec le monde externe ou les systèmes internes pour produire des effets significatifs. Il représente la phase d'acte de la boucle de perception, de raison, d'acte, où l'intention est transformée en comportement.

Lorsque le module cognitif sélectionne une action, il coordonne l'exécution par le biais de sous-modules spécialisés, où chaque sous-module s'aligne sur l'environnement intégré de l'agent :

  • Activation physique : pour les agents intégrés à des systèmes robotiques ou à des appareils IoT, ce sous-module traduit les décisions en mouvements physiques réels ou en instructions matérielles.

    Exemples : diriger un robot, déclencher une vanne, activer un capteur.

  • Interaction intégrée : ce sous-module gère les actions non physiques mais visibles de l'extérieur, telles que l'interaction avec des systèmes logiciels, des plateformes ou. APIs

    Exemples : envoi d'une commande à un service cloud, mise à jour d'une base de données, envoi d'un rapport en appelant une API.

  • Invocation d'outils : les agents étendent souvent leurs capacités en utilisant des outils spécialisés pour accomplir des sous-tâches telles que les suivantes :

    • Recherche : interrogation de sources de connaissances structurées ou non structurées

    • Résumé : compression des entrées de texte volumineuses en aperçus de haut niveau

    • Calcul : exécution de calculs logiques, numériques ou symboliques

    L'invocation d'outils permet de composer des comportements complexes grâce à des compétences modulaires et appelables.

Module d'apprentissage

Le module d'apprentissage permet aux agents de s'adapter, de généraliser et de s'améliorer au fil du temps en fonction de leur expérience. Il soutient le processus de raisonnement en affinant continuellement les modèles internes, les stratégies et les politiques de décision de l'agent en utilisant le feedback issu de la perception et de l'action.

Ce module fonctionne en coordination avec la mémoire à court terme et à long terme :

  • Mémoire à court terme : stocke le contexte transitoire, tel que l'état du dialogue, les informations sur les tâches en cours et les observations récentes. Cela aide l'agent à maintenir la continuité des interactions et des tâches.

  • Mémoire à long terme : code les connaissances persistantes issues d'expériences passées, y compris les objectifs atteints précédemment, les résultats des actions et les états environnementaux. La mémoire à long terme permet à l'agent de reconnaître des modèles, de réutiliser des stratégies et d'éviter de répéter les erreurs.

Modes d'apprentissage

Le module d'apprentissage prend en charge une gamme de paradigmes, tels que l'apprentissage supervisé, non supervisé et l'apprentissage par renforcement, qui prennent en charge différents environnements et rôles d'agent :

  • Apprentissage supervisé : met à jour les modèles internes sur la base d'exemples étiquetés, souvent à partir de commentaires humains ou d'ensembles de données de formation.

    Exemple : apprendre à classer les intentions des utilisateurs en fonction des conversations précédentes.

  • Apprentissage non supervisé : identifie les modèles ou les structures cachés dans les données sans étiquettes explicites.

    Exemple : regroupement de signaux environnementaux pour détecter des anomalies.

  • Apprentissage par renforcement : optimise le comportement par essais et erreurs en maximisant les récompenses cumulées dans les environnements interactifs.

    Exemple : apprendre quelle stratégie permet d'accomplir les tâches le plus rapidement.

L'apprentissage s'intègre étroitement au module cognitif de l'agent. Il affine les stratégies de planification en fonction des résultats passés, améliore la prise de décision grâce à l'évaluation des succès historiques et améliore continuellement la correspondance entre la perception et l'action. Grâce à cette boucle fermée d'apprentissage et de feedback, les agents évoluent au-delà de l'exécution réactive pour devenir des systèmes d'auto-amélioration capables de s'adapter à de nouveaux objectifs, conditions et contextes au fil du temps.