Arquitectura Description (Descripción)Capacidades Casos de uso comunes Implementación de agentes con memoria aumentada Implementación de mensajes con inyección de memoria Resumen

Agentes con memoria aumentada

Los agentes con memoria aumentada se han mejorado con la capacidad de almacenar, recuperar y razonar utilizando la memoria a corto y largo plazo. Esto les permite mantener el contexto en múltiples tareas, sesiones e interacciones, lo que produce respuestas más coherentes, personalizadas y estratégicas.

A diferencia de los agentes apátridas, los agentes con memoria aumentada se adaptan haciendo referencia a datos históricos, aprenden de los resultados anteriores y toman decisiones que se ajustan a los objetivos, las preferencias y el entorno del usuario.

Arquitectura

En el siguiente diagrama se muestra un agente con memoria aumentada:

Description (Descripción)

Recibe una entrada o un evento
- El agente recibe una consulta de usuario o un evento del sistema. Puede ser un texto, un desencadenante de la API o un cambio ambiental.
Recupera la memoria a corto plazo
- El agente recupera el historial de conversaciones recientes, el contexto de la tarea o el estado del sistema que sean relevantes para la sesión o el flujo de trabajo.
Recupera la memoria a largo plazo
- El agente consulta la memoria a largo plazo (por ejemplo, bases de datos vectoriales y almacenes de valores clave) para obtener información histórica, como la siguiente:
  - Preferencias de usuario
  - Decisiones y resultados pasados
  - Conceptos, resúmenes o experiencias aprendidas
Razones a través del LLM
- El contexto de la memoria está integrado en el indicador LLM, lo que permite al agente razonar basándose tanto en las entradas actuales como en los conocimientos previos.
Genera salidas
- El agente produce una respuesta, un plan o una acción sensibles al contexto que se personaliza de acuerdo con el historial de tareas y las aportaciones del usuario.
Actualiza la memoria
- La información nueva, como los objetivos actualizados, las señales de éxito y fracaso y las respuestas estructuradas, se almacena para futuras tareas.

Capacidades

Continuidad de la sesión en todas las conversaciones o eventos
Persistencia de objetivos a lo largo del tiempo
Conciencia contextual basada en un estado en evolución
Adaptabilidad basada en éxitos y fracasos anteriores
Personalización alineada con las preferencias y el historial del usuario

Casos de uso comunes

Copilotos conversacionales que recuerdan las preferencias del usuario
Agentes de codificación que rastrean los cambios en la base de código
Agentes de flujo de trabajo que se adaptan según el historial de tareas
Gemelos digitales que evolucionan a partir del conocimiento del sistema
Investigue los agentes que eviten las recuperaciones redundantes

Implementación de agentes con memoria aumentada

Utilice las siguientes herramientas y Servicios de AWS para los agentes con memoria aumentada:

Capa de memoria	Servicio de AWS	Finalidad
A corto plazo	Contexto de Amazon DynamoDB, Redis y Amazon Bedrock	Recuperación rápida de los estados de interacción recientes
A largo plazo (estructurado)	Amazon Aurora, Amazon DynamoDB, Amazon Neptune	Datos, relaciones y registros
A largo plazo (semántico)	OpenSearch, PostgreSQL, Pinecone	Recuperación basada en la incrustación (es decir, RAG)
Almacenamiento	Amazon S3	Almacenamiento de transcripciones, memorias estructuradas y archivos
Orquestación	AWS Lambda o bien AWS Step Functions	Gestión del ciclo de vida de las inyecciones y actualizaciones de memoria
Razonamiento	Amazon Bedrock	Claude o Mistral antrópicos con indicaciones de memoria

Implementación de mensajes con inyección de memoria

Para integrar la memoria en el razonamiento de los agentes, utilice una combinación de estado estructurado e inyección de contexto con recuperación aumentada:

Incluya el estado más reciente del agente y el historial de diálogos recientes como entrada estructurada al crear el mensaje para el modelo lingüístico, de modo que pueda razonar con todo el contexto.
Utilice la generación de recuperación aumentada (RAG) para extraer documentos o hechos relevantes de la memoria a largo plazo.
Resuma los planes, el contexto y las interacciones anteriores para hacerlos más comprensivos y relevantes.
Inserte módulos de memoria externos, como almacenes vectoriales o registros estructurados, durante la inferencia para guiar la toma de decisiones.

Resumen

Los agentes con memoria aumentada mantienen la continuidad del pensamiento al aprender de la experiencia y recordar el contexto del usuario. Estos agentes superan la inteligencia reactiva al utilizar la colaboración a largo plazo, la personalización y el razonamiento estratégico. En términos de inteligencia artificial, la memoria permite a los agentes comportarse más como homólogos digitales adaptables y menos como herramientas apátridas.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Agentes de orquestación del flujo de trabajo

Agentes de simulación y de banco de pruebas