Agenti con memoria aumentata - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Agenti con memoria aumentata

Gli agenti con memoria aumentata sono potenziati dalla capacità di archiviare, recuperare e ragionare utilizzando la memoria a breve e lungo termine. Ciò consente loro di mantenere il contesto tra più attività, sessioni e interazioni, il che produce risposte più coerenti, personalizzate e strategiche.

A differenza degli agenti stateless, gli agenti con memoria aumentata si adattano facendo riferimento a dati storici, imparano dai risultati precedenti e prendono decisioni in linea con gli obiettivi, le preferenze e l'ambiente dell'utente.

Architecture

Un agente con memoria aumentata è illustrato nel diagramma seguente:

Agenti con memoria aumentata.

Description

  1. Riceve input o eventi

    • L'agente riceve una richiesta dell'utente o un evento di sistema. Può trattarsi di un testo, di un trigger dell'API o di una modifica ambientale.

  2. Recupera la memoria a breve termine

    • L'agente recupera la cronologia delle conversazioni recenti, il contesto delle attività o lo stato del sistema pertinenti alla sessione o al flusso di lavoro.

  3. Recupera la memoria a lungo termine

    • L'agente interroga la memoria a lungo termine (ad esempio, database vettoriali e archivi chiave-valore) per informazioni storiche, come le seguenti:

      • Preferenze dell'utente

      • Decisioni e risultati passati

      • Concetti, riassunti o esperienze appresi

  4. Motivi tramite il LLM

    • Il contesto di memoria è incorporato nel prompt LLM e consente all'agente di ragionare in base sia agli input correnti che alle conoscenze precedenti.

  5. Genera uscite

    • L'agente produce una risposta, un piano o un'azione contestualmente consapevoli e personalizzati in base alla cronologia delle attività e agli input dell'utente.

  6. Aggiorna la memoria

    • Nuove informazioni, come obiettivi aggiornati, segnali di successo e fallimento e risposte strutturate, vengono archiviate per attività future.

Funzionalità

  • Continuità della sessione tra conversazioni o eventi

  • Persistenza degli obiettivi nel tempo

  • Consapevolezza contestuale basata su uno stato in evoluzione

  • Adattabilità basata su successi e fallimenti precedenti

  • Personalizzazione in linea con le preferenze e la cronologia dell'utente

Casi di utilizzo comune

  • Copiloti conversazionali che ricordano le preferenze dell'utente

  • Agenti di codifica che tengono traccia delle modifiche alla codebase

  • Agenti del flusso di lavoro che si adattano in base alla cronologia delle attività

  • Gemelli digitali che si evolvono a partire dalla conoscenza del sistema

  • Agenti di ricerca che evitano recuperi ridondanti

Implementazione di agenti con memoria aumentata

Utilizza i seguenti strumenti e Servizi AWS per gli agenti con memoria aumentata:

Livello di memoria

Servizio AWS

Scopo

A breve termine

Contesto Amazon DynamoDB, Redis, Amazon Bedrock

Recupero rapido degli stati di interazione recenti

A lungo termine (strutturato)

Amazon Aurora, Amazon DynamoDB, Amazon Neptune

Fatti, relazioni e registri

A lungo termine (semantico)

OpenSearch, PostgreSQL, Pinecone

Recupero basato sull'incorporamento (ovvero RAG)

Storage

Simple Storage Service (Amazon S3)

Archiviazione di trascrizioni, memorie strutturate e file

Orchestrazione

AWS Lambda oppure AWS Step Functions

Gestione dell'iniezione di memoria e del ciclo di vita degli aggiornamenti

Ragionamento

Amazon Bedrock

Claude o Mistral antropico con richieste di memoria

Implementazione dei prompt iniettati dalla memoria

Per integrare la memoria nel ragionamento degli agenti, utilizzate una combinazione di stati strutturati e iniezione di contesto potenziata dal recupero:

  • Includi lo stato più recente dell'agente e la cronologia recente dei dialoghi come input strutturato durante la creazione del prompt per il modello linguistico, in modo che possa ragionare con il contesto completo.

  • Usa la generazione aumentata di recupero (RAG) per estrarre documenti o fatti pertinenti dalla memoria a lungo termine.

  • Riassumi i piani, il contesto e le interazioni precedenti per la compressione e la pertinenza.

  • Inserisci moduli di memoria esterni, come archivi vettoriali o log strutturati, durante l'inferenza per guidare il processo decisionale.

Riepilogo

Gli agenti con memoria aumentata mantengono la continuità del pensiero imparando dall'esperienza e ricordando il contesto dell'utente. Questi agenti superano l'intelligenza reattiva utilizzando la collaborazione a lungo termine, la personalizzazione e il ragionamento strategico. In termini di intelligenza artificiale agentica, la memoria consente agli agenti di comportarsi più come controparti digitali adattive e meno come strumenti stateless.