Agentes com memória aumentada - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Agentes com memória aumentada

Os agentes com memória aumentada são aprimorados com a capacidade de armazenar, recuperar e raciocinar usando memória de curto e longo prazo. Isso permite que eles mantenham o contexto em várias tarefas, sessões e interações, o que produz respostas mais coerentes, personalizadas e estratégicas.

Diferentemente dos agentes apátridas, os agentes com memória aumentada se adaptam referenciando dados históricos, aprendem com resultados anteriores e tomam decisões alinhadas às metas, preferências e ambiente do usuário.

Arquitetura

Um agente com memória aumentada é mostrado no diagrama a seguir:

Agentes com memória aumentada.

Description

  1. Recebe informações ou eventos

    • O agente recebe uma consulta do usuário ou um evento do sistema. Isso pode ser um texto, um gatilho de API ou uma mudança ambiental.

  2. Recupera a memória de curto prazo

    • O agente recupera o histórico recente da conversa, o contexto da tarefa ou o estado do sistema que é relevante para a sessão ou o fluxo de trabalho.

  3. Recupera a memória de longo prazo

    • O agente consulta a memória de longo prazo (por exemplo, bancos de dados vetoriais e armazenamentos de valores-chave) para obter informações históricas, como as seguintes:

      • Preferências do usuário

      • Decisões e resultados anteriores

      • Conceitos, resumos ou experiências aprendidas

  4. Razões através do LLM

    • O contexto da memória é incorporado ao prompt do LLM, permitindo que o agente raciocine com base nas entradas atuais e no conhecimento prévio.

  5. Gera saídas

    • O agente produz uma resposta, um plano ou uma ação contextualmente consciente que é personalizada de acordo com o histórico da tarefa e as entradas do usuário.

  6. Atualiza a memória

    • Novas informações, como metas atualizadas, sinais de sucesso e fracasso e respostas estruturadas, são armazenadas para tarefas futuras.

Capacidades

  • Continuidade da sessão em conversas ou eventos

  • Persistência de metas ao longo do tempo

  • Consciência contextual baseada em um estado em evolução

  • Adaptabilidade informada por sucessos e fracassos anteriores

  • Personalização alinhada às preferências e ao histórico do usuário

Casos de uso comuns

  • Co-pilotos conversacionais que lembram as preferências do usuário

  • Agentes de codificação que rastreiam alterações na base de código

  • Agentes de fluxo de trabalho que se adaptam de acordo com o histórico de tarefas

  • Gêmeos digitais que evoluem a partir do conhecimento do sistema

  • Agentes de pesquisa que evitam recuperações redundantes

Implementação de agentes com memória aumentada

Use as seguintes ferramentas e Serviços da AWS para agentes com memória aumentada:

Camada de memória

AWS service (Serviço da AWS)

Finalidade

Curto prazo

Contexto do Amazon DynamoDB, Redis, Amazon Bedrock

Recuperação rápida de estados de interação recentes

Longo prazo (estruturado)

Amazon Aurora, Amazon DynamoDB, Amazon Neptune

Fatos, relacionamentos e registros

Longo prazo (semântico)

OpenSearch, PostgreSQL, Pinha

Recuperação baseada em incorporação (ou seja, RAG)

Armazenamento

Amazon S3

Armazenando transcrições, memórias estruturadas e arquivos

Orquestração

AWS Lambda or AWS Step Functions

Gerenciando o ciclo de vida de injeção e atualização de memória

Reasoning

Amazon Bedrock

Claude antrópico ou Mistral com alertas de memória

Implementando a solicitação com injeção de memória

Para integrar a memória ao raciocínio do agente, use uma combinação de estado estruturado e injeção de contexto com recuperação aumentada:

  • Inclua o estado mais recente do agente e o histórico recente de diálogos como entrada estruturada ao criar o prompt para o modelo de linguagem, para que ele possa raciocinar com todo o contexto.

  • Use a geração aumentada de recuperação (RAG) para extrair documentos ou fatos relevantes da memória de longo prazo.

  • Resuma os planos, o contexto e as interações anteriores para fins de compactação e relevância.

  • Injete módulos de memória externa, como armazenamentos vetoriais ou registros estruturados, durante a inferência para orientar a tomada de decisões.

Resumo

Agentes com memória aumentada mantêm a continuidade do pensamento aprendendo com a experiência e lembrando o contexto do usuário. Esses agentes superam a inteligência reativa usando colaboração, personalização e raciocínio estratégico de longo prazo. Em termos de IA agente, a memória permite que os agentes se comportem mais como contrapartes digitais adaptáveis e menos como ferramentas sem estado.