Architecture Description Fonctionnalités Cas d’utilisation courants Implémentation d'agents à mémoire augmentée Implémentation des instructions par injection de mémoire Résumé

Agents à mémoire augmentée

Les agents à mémoire augmentée sont améliorés grâce à la capacité de stocker, de récupérer et de raisonner en utilisant la mémoire à court et à long terme. Cela leur permet de maintenir le contexte entre plusieurs tâches, sessions et interactions, ce qui produit des réponses plus cohérentes, personnalisées et stratégiques.

Contrairement aux agents apatrides, les agents à mémoire augmentée s'adaptent en faisant référence à des données historiques, en tirant des leçons des résultats antérieurs et en prenant des décisions conformes aux objectifs, aux préférences et à l'environnement de l'utilisateur.

Architecture

Un agent à mémoire augmentée est illustré dans le schéma suivant :

Description

Reçoit une entrée ou un événement
- L'agent reçoit une requête de l'utilisateur ou un événement système. Il peut s'agir d'un texte, d'un déclencheur d'API ou d'un changement environnemental.
Récupère la mémoire à court terme
- L'agent récupère l'historique des conversations récentes, le contexte des tâches ou l'état du système correspondant à la session ou au flux de travail.
Récupère la mémoire à long terme
- L'agent interroge la mémoire à long terme (par exemple, les bases de données vectorielles et les banques de valeurs clés) pour obtenir des informations historiques, telles que les suivantes :
  - Préférences de l'utilisateur
  - Décisions et résultats antérieurs
  - Concepts, résumés ou expériences apprises
Raisons motivées par le LLM
- Le contexte de mémoire est intégré à l'invite LLM, ce qui permet à l'agent de raisonner en fonction à la fois des entrées actuelles et des connaissances antérieures.
Génère des sorties
- L'agent produit une réponse, un plan ou une action adaptés au contexte qui sont personnalisés en fonction de l'historique des tâches et des entrées de l'utilisateur.
Actualise la mémoire
- Les nouvelles informations, telles que les objectifs actualisés, les signaux de réussite et d'échec et les réponses structurées, sont stockées pour les tâches futures.

Fonctionnalités

Continuité des sessions entre les conversations ou les événements
Persistance des objectifs dans le temps
Conscience contextuelle basée sur un état en évolution
Adaptabilité éclairée par les succès et les échecs antérieurs
Personnalisation alignée sur les préférences et l'historique de l'utilisateur

Cas d’utilisation courants

Copilotes conversationnels qui mémorisent les préférences de l'utilisateur
Agents de codage qui suivent les modifications de la base de code
Des agents de flux de travail qui s'adaptent en fonction de l'historique des tâches
Des jumeaux numériques qui évoluent à partir de la connaissance du système
Des agents de recherche qui évitent les récupérations redondantes

Implémentation d'agents à mémoire augmentée

Utilisez les outils suivants et Services AWS pour les agents à mémoire augmentée :

Couche mémoire	Service AWS	Objectif
À court terme	Contexte Amazon DynamoDB, Redis, Amazon Bedrock	Récupération rapide des états d'interaction récents
À long terme (structuré)	Amazon Aurora, Amazon DynamoDB, Amazon Neptune	Faits, relations et journaux
À long terme (sémantique)	OpenSearch, PostgreSQL, Pinecone	Récupération basée sur l'intégration (c'est-à-dire RAG)
Stockage	Amazon S3	Stockage de transcriptions, de mémoires structurées et de fichiers
Orchestration	AWS Lambda ou AWS Step Functions	Gestion de l'injection de mémoire et du cycle de mise à jour
Raisonnement	Amazon Bedrock	Claude ou Mistral anthropique avec des instructions de mémorisation

Implémentation des instructions par injection de mémoire

Pour intégrer la mémoire dans le raisonnement des agents, utilisez une combinaison d'états structurés et d'injection de contexte augmentée par extraction :

Incluez l'état le plus récent de l'agent et l'historique récent des dialogues en tant qu'entrée structurée lors de la création de l'invite pour le modèle de langage, afin que celui-ci puisse raisonner en tenant compte du contexte complet.
Utilisez la génération augmentée par extraction (RAG) pour extraire des documents ou des faits pertinents de la mémoire à long terme.
Résumez les plans, le contexte et les interactions précédents à des fins de compression et de pertinence.
Injectez des modules de mémoire externes, tels que des magasins de vecteurs ou des journaux structurés, lors de l'inférence pour guider la prise de décision.

Résumé

Les agents à mémoire augmentée maintiennent la continuité des pensées en tirant des leçons de l'expérience et en mémorisant le contexte de l'utilisateur. Ces agents surpassent l'intelligence réactive en utilisant la collaboration à long terme, la personnalisation et le raisonnement stratégique. En termes d'IA agentique, la mémoire permet aux agents de se comporter davantage comme des homologues numériques adaptatifs que comme des outils apatrides.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Agents d'orchestration des flux de travail

Agents de simulation et de banc d'essai