As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Agentes com memória aumentada
Os agentes com memória aumentada são aprimorados com a capacidade de armazenar, recuperar e raciocinar usando memória de curto e longo prazo. Isso permite que eles mantenham o contexto em várias tarefas, sessões e interações, o que produz respostas mais coerentes, personalizadas e estratégicas.
Diferentemente dos agentes apátridas, os agentes com memória aumentada se adaptam referenciando dados históricos, aprendem com resultados anteriores e tomam decisões alinhadas às metas, preferências e ambiente do usuário.
Arquitetura
Um agente com memória aumentada é mostrado no diagrama a seguir:
Description
-
Recebe informações ou eventos
-
O agente recebe uma consulta do usuário ou um evento do sistema. Isso pode ser um texto, um gatilho de API ou uma mudança ambiental.
-
-
Recupera a memória de curto prazo
-
O agente recupera o histórico recente da conversa, o contexto da tarefa ou o estado do sistema que é relevante para a sessão ou o fluxo de trabalho.
-
-
Recupera a memória de longo prazo
-
O agente consulta a memória de longo prazo (por exemplo, bancos de dados vetoriais e armazenamentos de valores-chave) para obter informações históricas, como as seguintes:
-
Preferências do usuário
-
Decisões e resultados anteriores
-
Conceitos, resumos ou experiências aprendidas
-
-
-
Razões através do LLM
-
O contexto da memória é incorporado ao prompt do LLM, permitindo que o agente raciocine com base nas entradas atuais e no conhecimento prévio.
-
-
Gera saídas
-
O agente produz uma resposta, um plano ou uma ação contextualmente consciente que é personalizada de acordo com o histórico da tarefa e as entradas do usuário.
-
-
Atualiza a memória
-
Novas informações, como metas atualizadas, sinais de sucesso e fracasso e respostas estruturadas, são armazenadas para tarefas futuras.
-
Capacidades
-
Continuidade da sessão em conversas ou eventos
-
Persistência de metas ao longo do tempo
-
Consciência contextual baseada em um estado em evolução
-
Adaptabilidade informada por sucessos e fracassos anteriores
-
Personalização alinhada às preferências e ao histórico do usuário
Casos de uso comuns
-
Co-pilotos conversacionais que lembram as preferências do usuário
-
Agentes de codificação que rastreiam alterações na base de código
-
Agentes de fluxo de trabalho que se adaptam de acordo com o histórico de tarefas
-
Gêmeos digitais que evoluem a partir do conhecimento do sistema
-
Agentes de pesquisa que evitam recuperações redundantes
Implementação de agentes com memória aumentada
Use as seguintes ferramentas e Serviços da AWS para agentes com memória aumentada:
Camada de memória |
AWS service (Serviço da AWS) |
Finalidade |
|---|---|---|
Curto prazo |
Contexto do Amazon DynamoDB, Redis, Amazon Bedrock |
Recuperação rápida de estados de interação recentes |
Longo prazo (estruturado) |
Amazon Aurora, Amazon DynamoDB, Amazon Neptune |
Fatos, relacionamentos e registros |
Longo prazo (semântico) |
OpenSearch, PostgreSQL, Pinha |
Recuperação baseada em incorporação (ou seja, RAG) |
Armazenamento |
Amazon S3 |
Armazenando transcrições, memórias estruturadas e arquivos |
Orquestração |
AWS Lambda or AWS Step Functions |
Gerenciando o ciclo de vida de injeção e atualização de memória |
Reasoning |
Amazon Bedrock |
Claude antrópico ou Mistral com alertas de memória |
Implementando a solicitação com injeção de memória
Para integrar a memória ao raciocínio do agente, use uma combinação de estado estruturado e injeção de contexto com recuperação aumentada:
-
Inclua o estado mais recente do agente e o histórico recente de diálogos como entrada estruturada ao criar o prompt para o modelo de linguagem, para que ele possa raciocinar com todo o contexto.
-
Use a geração aumentada de recuperação (RAG) para extrair documentos ou fatos relevantes da memória de longo prazo.
-
Resuma os planos, o contexto e as interações anteriores para fins de compactação e relevância.
-
Injete módulos de memória externa, como armazenamentos vetoriais ou registros estruturados, durante a inferência para orientar a tomada de decisões.
Resumo
Agentes com memória aumentada mantêm a continuidade do pensamento aprendendo com a experiência e lembrando o contexto do usuário. Esses agentes superam a inteligência reativa usando colaboração, personalização e raciocínio estratégico de longo prazo. Em termos de IA agente, a memória permite que os agentes se comportem mais como contrapartes digitais adaptáveis e menos como ferramentas sem estado.