Agentes con memoria aumentada - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Agentes con memoria aumentada

Los agentes con memoria aumentada se han mejorado con la capacidad de almacenar, recuperar y razonar utilizando la memoria a corto y largo plazo. Esto les permite mantener el contexto en múltiples tareas, sesiones e interacciones, lo que produce respuestas más coherentes, personalizadas y estratégicas.

A diferencia de los agentes apátridas, los agentes con memoria aumentada se adaptan haciendo referencia a datos históricos, aprenden de los resultados anteriores y toman decisiones que se ajustan a los objetivos, las preferencias y el entorno del usuario.

Arquitectura

En el siguiente diagrama se muestra un agente con memoria aumentada:

Agentes con memoria aumentada.

Description (Descripción)

  1. Recibe una entrada o un evento

    • El agente recibe una consulta de usuario o un evento del sistema. Puede ser un texto, un desencadenante de la API o un cambio ambiental.

  2. Recupera la memoria a corto plazo

    • El agente recupera el historial de conversaciones recientes, el contexto de la tarea o el estado del sistema que sean relevantes para la sesión o el flujo de trabajo.

  3. Recupera la memoria a largo plazo

    • El agente consulta la memoria a largo plazo (por ejemplo, bases de datos vectoriales y almacenes de valores clave) para obtener información histórica, como la siguiente:

      • Preferencias de usuario

      • Decisiones y resultados pasados

      • Conceptos, resúmenes o experiencias aprendidas

  4. Razones a través del LLM

    • El contexto de la memoria está integrado en el indicador LLM, lo que permite al agente razonar basándose tanto en las entradas actuales como en los conocimientos previos.

  5. Genera salidas

    • El agente produce una respuesta, un plan o una acción sensibles al contexto que se personaliza de acuerdo con el historial de tareas y las aportaciones del usuario.

  6. Actualiza la memoria

    • La información nueva, como los objetivos actualizados, las señales de éxito y fracaso y las respuestas estructuradas, se almacena para futuras tareas.

Capacidades

  • Continuidad de la sesión en todas las conversaciones o eventos

  • Persistencia de objetivos a lo largo del tiempo

  • Conciencia contextual basada en un estado en evolución

  • Adaptabilidad basada en éxitos y fracasos anteriores

  • Personalización alineada con las preferencias y el historial del usuario

Casos de uso comunes

  • Copilotos conversacionales que recuerdan las preferencias del usuario

  • Agentes de codificación que rastrean los cambios en la base de código

  • Agentes de flujo de trabajo que se adaptan según el historial de tareas

  • Gemelos digitales que evolucionan a partir del conocimiento del sistema

  • Investigue los agentes que eviten las recuperaciones redundantes

Implementación de agentes con memoria aumentada

Utilice las siguientes herramientas y Servicios de AWS para los agentes con memoria aumentada:

Capa de memoria

Servicio de AWS

Finalidad

A corto plazo

Contexto de Amazon DynamoDB, Redis y Amazon Bedrock

Recuperación rápida de los estados de interacción recientes

A largo plazo (estructurado)

Amazon Aurora, Amazon DynamoDB, Amazon Neptune

Datos, relaciones y registros

A largo plazo (semántico)

OpenSearch, PostgreSQL, Pinecone

Recuperación basada en la incrustación (es decir, RAG)

Almacenamiento

Amazon S3

Almacenamiento de transcripciones, memorias estructuradas y archivos

Orquestación

AWS Lambda o bien AWS Step Functions

Gestión del ciclo de vida de las inyecciones y actualizaciones de memoria

Razonamiento

Amazon Bedrock

Claude o Mistral antrópicos con indicaciones de memoria

Implementación de mensajes con inyección de memoria

Para integrar la memoria en el razonamiento de los agentes, utilice una combinación de estado estructurado e inyección de contexto con recuperación aumentada:

  • Incluya el estado más reciente del agente y el historial de diálogos recientes como entrada estructurada al crear el mensaje para el modelo lingüístico, de modo que pueda razonar con todo el contexto.

  • Utilice la generación de recuperación aumentada (RAG) para extraer documentos o hechos relevantes de la memoria a largo plazo.

  • Resuma los planes, el contexto y las interacciones anteriores para hacerlos más comprensivos y relevantes.

  • Inserte módulos de memoria externos, como almacenes vectoriales o registros estructurados, durante la inferencia para guiar la toma de decisiones.

Resumen

Los agentes con memoria aumentada mantienen la continuidad del pensamiento al aprender de la experiencia y recordar el contexto del usuario. Estos agentes superan la inteligencia reactiva al utilizar la colaboración a largo plazo, la personalización y el razonamiento estratégico. En términos de inteligencia artificial, la memoria permite a los agentes comportarse más como homólogos digitales adaptables y menos como herramientas apátridas.