Architecture Description Funzionalità Casi di utilizzo comune Implementazione di agenti con memoria aumentata Implementazione dei prompt iniettati dalla memoria Riepilogo

Agenti con memoria aumentata

Gli agenti con memoria aumentata sono potenziati dalla capacità di archiviare, recuperare e ragionare utilizzando la memoria a breve e lungo termine. Ciò consente loro di mantenere il contesto tra più attività, sessioni e interazioni, il che produce risposte più coerenti, personalizzate e strategiche.

A differenza degli agenti stateless, gli agenti con memoria aumentata si adattano facendo riferimento a dati storici, imparano dai risultati precedenti e prendono decisioni in linea con gli obiettivi, le preferenze e l'ambiente dell'utente.

Architecture

Un agente con memoria aumentata è illustrato nel diagramma seguente:

Description

Riceve input o eventi
- L'agente riceve una richiesta dell'utente o un evento di sistema. Può trattarsi di un testo, di un trigger dell'API o di una modifica ambientale.
Recupera la memoria a breve termine
- L'agente recupera la cronologia delle conversazioni recenti, il contesto delle attività o lo stato del sistema pertinenti alla sessione o al flusso di lavoro.
Recupera la memoria a lungo termine
- L'agente interroga la memoria a lungo termine (ad esempio, database vettoriali e archivi chiave-valore) per informazioni storiche, come le seguenti:
  - Preferenze dell'utente
  - Decisioni e risultati passati
  - Concetti, riassunti o esperienze appresi
Motivi tramite il LLM
- Il contesto di memoria è incorporato nel prompt LLM e consente all'agente di ragionare in base sia agli input correnti che alle conoscenze precedenti.
Genera uscite
- L'agente produce una risposta, un piano o un'azione contestualmente consapevoli e personalizzati in base alla cronologia delle attività e agli input dell'utente.
Aggiorna la memoria
- Nuove informazioni, come obiettivi aggiornati, segnali di successo e fallimento e risposte strutturate, vengono archiviate per attività future.

Funzionalità

Continuità della sessione tra conversazioni o eventi
Persistenza degli obiettivi nel tempo
Consapevolezza contestuale basata su uno stato in evoluzione
Adattabilità basata su successi e fallimenti precedenti
Personalizzazione in linea con le preferenze e la cronologia dell'utente

Casi di utilizzo comune

Copiloti conversazionali che ricordano le preferenze dell'utente
Agenti di codifica che tengono traccia delle modifiche alla codebase
Agenti del flusso di lavoro che si adattano in base alla cronologia delle attività
Gemelli digitali che si evolvono a partire dalla conoscenza del sistema
Agenti di ricerca che evitano recuperi ridondanti

Implementazione di agenti con memoria aumentata

Utilizza i seguenti strumenti e Servizi AWS per gli agenti con memoria aumentata:

Livello di memoria	Servizio AWS	Scopo
A breve termine	Contesto Amazon DynamoDB, Redis, Amazon Bedrock	Recupero rapido degli stati di interazione recenti
A lungo termine (strutturato)	Amazon Aurora, Amazon DynamoDB, Amazon Neptune	Fatti, relazioni e registri
A lungo termine (semantico)	OpenSearch, PostgreSQL, Pinecone	Recupero basato sull'incorporamento (ovvero RAG)
Archiviazione	Simple Storage Service (Amazon S3)	Archiviazione di trascrizioni, memorie strutturate e file
Orchestrazione	AWS Lambda oppure AWS Step Functions	Gestione dell'iniezione di memoria e del ciclo di vita degli aggiornamenti
Ragionamento	Amazon Bedrock	Claude o Mistral antropico con richieste di memoria

Implementazione dei prompt iniettati dalla memoria

Per integrare la memoria nel ragionamento degli agenti, utilizzate una combinazione di stati strutturati e iniezione di contesto potenziata dal recupero:

Includi lo stato più recente dell'agente e la cronologia recente dei dialoghi come input strutturato durante la creazione del prompt per il modello linguistico, in modo che possa ragionare con il contesto completo.
Usa la generazione aumentata di recupero (RAG) per estrarre documenti o fatti pertinenti dalla memoria a lungo termine.
Riassumi i piani, il contesto e le interazioni precedenti per la compressione e la pertinenza.
Inserisci moduli di memoria esterni, come archivi vettoriali o log strutturati, durante l'inferenza per guidare il processo decisionale.

Riepilogo

Gli agenti con memoria aumentata mantengono la continuità del pensiero imparando dall'esperienza e ricordando il contesto dell'utente. Questi agenti superano l'intelligenza reattiva utilizzando la collaborazione a lungo termine, la personalizzazione e il ragionamento strategico. In termini di intelligenza artificiale agentica, la memoria consente agli agenti di comportarsi più come controparti digitali adattive e meno come strumenti stateless.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Agenti di orchestrazione del flusso di lavoro

Agenti di simulazione e test