Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Agenti con memoria aumentata
Gli agenti con memoria aumentata sono potenziati dalla capacità di archiviare, recuperare e ragionare utilizzando la memoria a breve e lungo termine. Ciò consente loro di mantenere il contesto tra più attività, sessioni e interazioni, il che produce risposte più coerenti, personalizzate e strategiche.
A differenza degli agenti stateless, gli agenti con memoria aumentata si adattano facendo riferimento a dati storici, imparano dai risultati precedenti e prendono decisioni in linea con gli obiettivi, le preferenze e l'ambiente dell'utente.
Architecture
Un agente con memoria aumentata è illustrato nel diagramma seguente:
Description
-
Riceve input o eventi
-
L'agente riceve una richiesta dell'utente o un evento di sistema. Può trattarsi di un testo, di un trigger dell'API o di una modifica ambientale.
-
-
Recupera la memoria a breve termine
-
L'agente recupera la cronologia delle conversazioni recenti, il contesto delle attività o lo stato del sistema pertinenti alla sessione o al flusso di lavoro.
-
-
Recupera la memoria a lungo termine
-
L'agente interroga la memoria a lungo termine (ad esempio, database vettoriali e archivi chiave-valore) per informazioni storiche, come le seguenti:
-
Preferenze dell'utente
-
Decisioni e risultati passati
-
Concetti, riassunti o esperienze appresi
-
-
-
Motivi tramite il LLM
-
Il contesto di memoria è incorporato nel prompt LLM e consente all'agente di ragionare in base sia agli input correnti che alle conoscenze precedenti.
-
-
Genera uscite
-
L'agente produce una risposta, un piano o un'azione contestualmente consapevoli e personalizzati in base alla cronologia delle attività e agli input dell'utente.
-
-
Aggiorna la memoria
-
Nuove informazioni, come obiettivi aggiornati, segnali di successo e fallimento e risposte strutturate, vengono archiviate per attività future.
-
Funzionalità
-
Continuità della sessione tra conversazioni o eventi
-
Persistenza degli obiettivi nel tempo
-
Consapevolezza contestuale basata su uno stato in evoluzione
-
Adattabilità basata su successi e fallimenti precedenti
-
Personalizzazione in linea con le preferenze e la cronologia dell'utente
Casi di utilizzo comune
-
Copiloti conversazionali che ricordano le preferenze dell'utente
-
Agenti di codifica che tengono traccia delle modifiche alla codebase
-
Agenti del flusso di lavoro che si adattano in base alla cronologia delle attività
-
Gemelli digitali che si evolvono a partire dalla conoscenza del sistema
-
Agenti di ricerca che evitano recuperi ridondanti
Implementazione di agenti con memoria aumentata
Utilizza i seguenti strumenti e Servizi AWS per gli agenti con memoria aumentata:
Livello di memoria |
Servizio AWS |
Scopo |
|---|---|---|
A breve termine |
Contesto Amazon DynamoDB, Redis, Amazon Bedrock |
Recupero rapido degli stati di interazione recenti |
A lungo termine (strutturato) |
Amazon Aurora, Amazon DynamoDB, Amazon Neptune |
Fatti, relazioni e registri |
A lungo termine (semantico) |
OpenSearch, PostgreSQL, Pinecone |
Recupero basato sull'incorporamento (ovvero RAG) |
Storage |
Simple Storage Service (Amazon S3) |
Archiviazione di trascrizioni, memorie strutturate e file |
Orchestrazione |
AWS Lambda oppure AWS Step Functions |
Gestione dell'iniezione di memoria e del ciclo di vita degli aggiornamenti |
Ragionamento |
Amazon Bedrock |
Claude o Mistral antropico con richieste di memoria |
Implementazione dei prompt iniettati dalla memoria
Per integrare la memoria nel ragionamento degli agenti, utilizzate una combinazione di stati strutturati e iniezione di contesto potenziata dal recupero:
-
Includi lo stato più recente dell'agente e la cronologia recente dei dialoghi come input strutturato durante la creazione del prompt per il modello linguistico, in modo che possa ragionare con il contesto completo.
-
Usa la generazione aumentata di recupero (RAG) per estrarre documenti o fatti pertinenti dalla memoria a lungo termine.
-
Riassumi i piani, il contesto e le interazioni precedenti per la compressione e la pertinenza.
-
Inserisci moduli di memoria esterni, come archivi vettoriali o log strutturati, durante l'inferenza per guidare il processo decisionale.
Riepilogo
Gli agenti con memoria aumentata mantengono la continuità del pensiero imparando dall'esperienza e ricordando il contesto dell'utente. Questi agenti superano l'intelligenza reattiva utilizzando la collaborazione a lungo termine, la personalizzazione e il ragionamento strategico. In termini di intelligenza artificiale agentica, la memoria consente agli agenti di comportarsi più come controparti digitali adattive e meno come strumenti stateless.