Arquitetura Description Capacidades Casos de uso comuns Implementação de agentes com memória aumentada Implementando a solicitação com injeção de memória Resumo

Agentes com memória aumentada

Os agentes com memória aumentada são aprimorados com a capacidade de armazenar, recuperar e raciocinar usando memória de curto e longo prazo. Isso permite que eles mantenham o contexto em várias tarefas, sessões e interações, o que produz respostas mais coerentes, personalizadas e estratégicas.

Diferentemente dos agentes apátridas, os agentes com memória aumentada se adaptam referenciando dados históricos, aprendem com resultados anteriores e tomam decisões alinhadas às metas, preferências e ambiente do usuário.

Arquitetura

Um agente com memória aumentada é mostrado no diagrama a seguir:

Description

Recebe informações ou eventos
- O agente recebe uma consulta do usuário ou um evento do sistema. Isso pode ser um texto, um gatilho de API ou uma mudança ambiental.
Recupera a memória de curto prazo
- O agente recupera o histórico recente da conversa, o contexto da tarefa ou o estado do sistema que é relevante para a sessão ou o fluxo de trabalho.
Recupera a memória de longo prazo
- O agente consulta a memória de longo prazo (por exemplo, bancos de dados vetoriais e armazenamentos de valores-chave) para obter informações históricas, como as seguintes:
  - Preferências do usuário
  - Decisões e resultados anteriores
  - Conceitos, resumos ou experiências aprendidas
Razões através do LLM
- O contexto da memória é incorporado ao prompt do LLM, permitindo que o agente raciocine com base nas entradas atuais e no conhecimento prévio.
Gera saídas
- O agente produz uma resposta, um plano ou uma ação contextualmente consciente que é personalizada de acordo com o histórico da tarefa e as entradas do usuário.
Atualiza a memória
- Novas informações, como metas atualizadas, sinais de sucesso e fracasso e respostas estruturadas, são armazenadas para tarefas futuras.

Capacidades

Continuidade da sessão em conversas ou eventos
Persistência de metas ao longo do tempo
Consciência contextual baseada em um estado em evolução
Adaptabilidade informada por sucessos e fracassos anteriores
Personalização alinhada às preferências e ao histórico do usuário

Casos de uso comuns

Co-pilotos conversacionais que lembram as preferências do usuário
Agentes de codificação que rastreiam alterações na base de código
Agentes de fluxo de trabalho que se adaptam de acordo com o histórico de tarefas
Gêmeos digitais que evoluem a partir do conhecimento do sistema
Agentes de pesquisa que evitam recuperações redundantes

Implementação de agentes com memória aumentada

Use as seguintes ferramentas e Serviços da AWS para agentes com memória aumentada:

Camada de memória	AWS service (Serviço da AWS)	Finalidade
Curto prazo	Contexto do Amazon DynamoDB, Redis, Amazon Bedrock	Recuperação rápida de estados de interação recentes
Longo prazo (estruturado)	Amazon Aurora, Amazon DynamoDB, Amazon Neptune	Fatos, relacionamentos e registros
Longo prazo (semântico)	OpenSearch, PostgreSQL, Pinha	Recuperação baseada em incorporação (ou seja, RAG)
Armazenamento	Amazon S3	Armazenando transcrições, memórias estruturadas e arquivos
Orquestração	AWS Lambda or AWS Step Functions	Gerenciando o ciclo de vida de injeção e atualização de memória
Reasoning	Amazon Bedrock	Claude antrópico ou Mistral com alertas de memória

Implementando a solicitação com injeção de memória

Para integrar a memória ao raciocínio do agente, use uma combinação de estado estruturado e injeção de contexto com recuperação aumentada:

Inclua o estado mais recente do agente e o histórico recente de diálogos como entrada estruturada ao criar o prompt para o modelo de linguagem, para que ele possa raciocinar com todo o contexto.
Use a geração aumentada de recuperação (RAG) para extrair documentos ou fatos relevantes da memória de longo prazo.
Resuma os planos, o contexto e as interações anteriores para fins de compactação e relevância.
Injete módulos de memória externa, como armazenamentos vetoriais ou registros estruturados, durante a inferência para orientar a tomada de decisões.

Resumo

Agentes com memória aumentada mantêm a continuidade do pensamento aprendendo com a experiência e lembrando o contexto do usuário. Esses agentes superam a inteligência reativa usando colaboração, personalização e raciocínio estratégico de longo prazo. Em termos de IA agente, a memória permite que os agentes se comportem mais como contrapartes digitais adaptáveis e menos como ferramentas sem estado.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Agentes de orquestração de fluxo de trabalho

Agentes de simulação e de teste