Agents à mémoire augmentée - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Agents à mémoire augmentée

Les agents à mémoire augmentée sont améliorés grâce à la capacité de stocker, de récupérer et de raisonner en utilisant la mémoire à court et à long terme. Cela leur permet de maintenir le contexte entre plusieurs tâches, sessions et interactions, ce qui produit des réponses plus cohérentes, personnalisées et stratégiques.

Contrairement aux agents apatrides, les agents à mémoire augmentée s'adaptent en faisant référence à des données historiques, en tirant des leçons des résultats antérieurs et en prenant des décisions conformes aux objectifs, aux préférences et à l'environnement de l'utilisateur.

Architecture

Un agent à mémoire augmentée est illustré dans le schéma suivant :

Agents à mémoire augmentée.

Description

  1. Reçoit une entrée ou un événement

    • L'agent reçoit une requête de l'utilisateur ou un événement système. Il peut s'agir d'un texte, d'un déclencheur d'API ou d'un changement environnemental.

  2. Récupère la mémoire à court terme

    • L'agent récupère l'historique des conversations récentes, le contexte des tâches ou l'état du système correspondant à la session ou au flux de travail.

  3. Récupère la mémoire à long terme

    • L'agent interroge la mémoire à long terme (par exemple, les bases de données vectorielles et les banques de valeurs clés) pour obtenir des informations historiques, telles que les suivantes :

      • Préférences de l'utilisateur

      • Décisions et résultats antérieurs

      • Concepts, résumés ou expériences apprises

  4. Raisons motivées par le LLM

    • Le contexte de mémoire est intégré à l'invite LLM, ce qui permet à l'agent de raisonner en fonction à la fois des entrées actuelles et des connaissances antérieures.

  5. Génère des sorties

    • L'agent produit une réponse, un plan ou une action adaptés au contexte qui sont personnalisés en fonction de l'historique des tâches et des entrées de l'utilisateur.

  6. Actualise la mémoire

    • Les nouvelles informations, telles que les objectifs actualisés, les signaux de réussite et d'échec et les réponses structurées, sont stockées pour les tâches futures.

Fonctionnalités

  • Continuité des sessions entre les conversations ou les événements

  • Persistance des objectifs dans le temps

  • Conscience contextuelle basée sur un état en évolution

  • Adaptabilité éclairée par les succès et les échecs antérieurs

  • Personnalisation alignée sur les préférences et l'historique de l'utilisateur

Cas d’utilisation courants

  • Copilotes conversationnels qui mémorisent les préférences de l'utilisateur

  • Agents de codage qui suivent les modifications de la base de code

  • Des agents de flux de travail qui s'adaptent en fonction de l'historique des tâches

  • Des jumeaux numériques qui évoluent à partir de la connaissance du système

  • Des agents de recherche qui évitent les récupérations redondantes

Implémentation d'agents à mémoire augmentée

Utilisez les outils suivants et Services AWS pour les agents à mémoire augmentée :

Couche mémoire

Service AWS

Objectif

À court terme

Contexte Amazon DynamoDB, Redis, Amazon Bedrock

Récupération rapide des états d'interaction récents

À long terme (structuré)

Amazon Aurora, Amazon DynamoDB, Amazon Neptune

Faits, relations et journaux

À long terme (sémantique)

OpenSearch, PostgreSQL, Pinecone

Récupération basée sur l'intégration (c'est-à-dire RAG)

Stockage

Amazon S3

Stockage de transcriptions, de mémoires structurées et de fichiers

Orchestration

AWS Lambda ou AWS Step Functions

Gestion de l'injection de mémoire et du cycle de mise à jour

Raisonnement

Amazon Bedrock

Claude ou Mistral anthropique avec des instructions de mémorisation

Implémentation des instructions par injection de mémoire

Pour intégrer la mémoire dans le raisonnement des agents, utilisez une combinaison d'états structurés et d'injection de contexte augmentée par extraction :

  • Incluez l'état le plus récent de l'agent et l'historique récent des dialogues en tant qu'entrée structurée lors de la création de l'invite pour le modèle de langage, afin que celui-ci puisse raisonner en tenant compte du contexte complet.

  • Utilisez la génération augmentée par extraction (RAG) pour extraire des documents ou des faits pertinents de la mémoire à long terme.

  • Résumez les plans, le contexte et les interactions précédents à des fins de compression et de pertinence.

  • Injectez des modules de mémoire externes, tels que des magasins de vecteurs ou des journaux structurés, lors de l'inférence pour guider la prise de décision.

Résumé

Les agents à mémoire augmentée maintiennent la continuité des pensées en tirant des leçons de l'expérience et en mémorisant le contexte de l'utilisateur. Ces agents surpassent l'intelligence réactive en utilisant la collaboration à long terme, la personnalisation et le raisonnement stratégique. En termes d'IA agentique, la mémoire permet aux agents de se comporter davantage comme des homologues numériques adaptatifs que comme des outils apatrides.