As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Agentes com memória aumentada
<a name="memory-augmented-agents"></a>

Os agentes com memória aumentada são aprimorados com a capacidade de armazenar, recuperar e raciocinar usando memória de curto e longo prazo. Isso permite que eles mantenham o contexto em várias tarefas, sessões e interações, o que produz respostas mais coerentes, personalizadas e estratégicas.

Diferentemente dos agentes apátridas, os agentes com memória aumentada se adaptam referenciando dados históricos, aprendem com resultados anteriores e tomam decisões alinhadas às metas, preferências e ambiente do usuário.

## Arquitetura
<a name="architecture-memory-augmented"></a>

Um agente com memória aumentada é mostrado no diagrama a seguir:

![\[Agentes com memória aumentada.\]](http://docs.aws.amazon.com/pt_br/prescriptive-guidance/latest/agentic-ai-patterns/images/memory-augmented-agents.png)


## Description
<a name="description-memory-augmented"></a>

1. Recebe informações ou eventos
   + O agente recebe uma consulta do usuário ou um evento do sistema. Isso pode ser um texto, um gatilho de API ou uma mudança ambiental.

1. Recupera a memória de curto prazo
   + O agente recupera o histórico recente da conversa, o contexto da tarefa ou o estado do sistema que é relevante para a sessão ou o fluxo de trabalho.

1. Recupera a memória de longo prazo
   + O agente consulta a memória de longo prazo (por exemplo, bancos de dados vetoriais e armazenamentos de valores-chave) para obter informações históricas, como as seguintes:
     + Preferências do usuário
     + Decisões e resultados anteriores
     + Conceitos, resumos ou experiências aprendidas

1. Razões através do LLM
   + O contexto da memória é incorporado ao prompt do LLM, permitindo que o agente raciocine com base nas entradas atuais e no conhecimento prévio.

1. Gera saídas
   + O agente produz uma resposta, um plano ou uma ação contextualmente consciente que é personalizada de acordo com o histórico da tarefa e as entradas do usuário.

1. Atualiza a memória
   + Novas informações, como metas atualizadas, sinais de sucesso e fracasso e respostas estruturadas, são armazenadas para tarefas futuras.

## Capacidades
<a name="capabilities-memory-augmented"></a>
+ Continuidade da sessão em conversas ou eventos
+ Persistência de metas ao longo do tempo
+ Consciência contextual baseada em um estado em evolução
+ Adaptabilidade informada por sucessos e fracassos anteriores
+ Personalização alinhada às preferências e ao histórico do usuário

## Casos de uso comuns
<a name="common-use-cases-memory-augmented"></a>
+ Co-pilotos conversacionais que lembram as preferências do usuário
+ Agentes de codificação que rastreiam alterações na base de código
+ Agentes de fluxo de trabalho que se adaptam de acordo com o histórico de tarefas
+ Gêmeos digitais que evoluem a partir do conhecimento do sistema
+ Agentes de pesquisa que evitam recuperações redundantes

## Implementação de agentes com memória aumentada
<a name="implementing-memory-augmented-agents"></a>

Use as seguintes ferramentas e Serviços da AWS para agentes com memória aumentada:


| 
| 
| **Camada de memória** | **AWS service (Serviço da AWS)** | **Finalidade** | 
| --- |--- |--- |
| Curto prazo | Contexto do Amazon DynamoDB, Redis, Amazon Bedrock | Recuperação rápida de estados de interação recentes | 
| Longo prazo (estruturado) | Amazon Aurora, Amazon DynamoDB, Amazon Neptune | Fatos, relacionamentos e registros | 
| Longo prazo (semântico) | OpenSearch, PostgreSQL, Pinha | Recuperação baseada em incorporação (ou seja, RAG) | 
| Armazenamento | Amazon S3 | Armazenando transcrições, memórias estruturadas e arquivos | 
| Orquestração | AWS Lambda or AWS Step Functions | Gerenciando o ciclo de vida de injeção e atualização de memória | 
| Reasoning | Amazon Bedrock | Claude antrópico ou Mistral com alertas de memória | 

## Implementando a solicitação com injeção de memória
<a name="implementing-memory-injected-prompting"></a>

Para integrar a memória ao raciocínio do agente, use uma combinação de estado estruturado e injeção de contexto com recuperação aumentada:
+ Inclua o estado mais recente do agente e o histórico recente de diálogos como entrada estruturada ao criar o prompt para o modelo de linguagem, para que ele possa raciocinar com todo o contexto.
+ Use a geração aumentada de recuperação (RAG) para extrair documentos ou fatos relevantes da memória de longo prazo.
+ Resuma os planos, o contexto e as interações anteriores para fins de compactação e relevância.
+ Injete módulos de memória externa, como armazenamentos vetoriais ou registros estruturados, durante a inferência para orientar a tomada de decisões.

## Resumo
<a name="summary-memory-augmented"></a>

Agentes com memória aumentada mantêm a continuidade do pensamento aprendendo com a experiência e lembrando o contexto do usuário. Esses agentes superam a inteligência reativa usando colaboração, personalização e raciocínio estratégico de longo prazo. Em termos de IA agente, a memória permite que os agentes se comportem mais como contrapartes digitais adaptáveis e menos como ferramentas sem estado.