Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Agentes con memoria aumentada
Los agentes con memoria aumentada se han mejorado con la capacidad de almacenar, recuperar y razonar utilizando la memoria a corto y largo plazo. Esto les permite mantener el contexto en múltiples tareas, sesiones e interacciones, lo que produce respuestas más coherentes, personalizadas y estratégicas.
A diferencia de los agentes apátridas, los agentes con memoria aumentada se adaptan haciendo referencia a datos históricos, aprenden de los resultados anteriores y toman decisiones que se ajustan a los objetivos, las preferencias y el entorno del usuario.
Arquitectura
En el siguiente diagrama se muestra un agente con memoria aumentada:
Description (Descripción)
-
Recibe una entrada o un evento
-
El agente recibe una consulta de usuario o un evento del sistema. Puede ser un texto, un desencadenante de la API o un cambio ambiental.
-
-
Recupera la memoria a corto plazo
-
El agente recupera el historial de conversaciones recientes, el contexto de la tarea o el estado del sistema que sean relevantes para la sesión o el flujo de trabajo.
-
-
Recupera la memoria a largo plazo
-
El agente consulta la memoria a largo plazo (por ejemplo, bases de datos vectoriales y almacenes de valores clave) para obtener información histórica, como la siguiente:
-
Preferencias de usuario
-
Decisiones y resultados pasados
-
Conceptos, resúmenes o experiencias aprendidas
-
-
-
Razones a través del LLM
-
El contexto de la memoria está integrado en el indicador LLM, lo que permite al agente razonar basándose tanto en las entradas actuales como en los conocimientos previos.
-
-
Genera salidas
-
El agente produce una respuesta, un plan o una acción sensibles al contexto que se personaliza de acuerdo con el historial de tareas y las aportaciones del usuario.
-
-
Actualiza la memoria
-
La información nueva, como los objetivos actualizados, las señales de éxito y fracaso y las respuestas estructuradas, se almacena para futuras tareas.
-
Capacidades
-
Continuidad de la sesión en todas las conversaciones o eventos
-
Persistencia de objetivos a lo largo del tiempo
-
Conciencia contextual basada en un estado en evolución
-
Adaptabilidad basada en éxitos y fracasos anteriores
-
Personalización alineada con las preferencias y el historial del usuario
Casos de uso comunes
-
Copilotos conversacionales que recuerdan las preferencias del usuario
-
Agentes de codificación que rastrean los cambios en la base de código
-
Agentes de flujo de trabajo que se adaptan según el historial de tareas
-
Gemelos digitales que evolucionan a partir del conocimiento del sistema
-
Investigue los agentes que eviten las recuperaciones redundantes
Implementación de agentes con memoria aumentada
Utilice las siguientes herramientas y Servicios de AWS para los agentes con memoria aumentada:
Capa de memoria |
Servicio de AWS |
Finalidad |
|---|---|---|
A corto plazo |
Contexto de Amazon DynamoDB, Redis y Amazon Bedrock |
Recuperación rápida de los estados de interacción recientes |
A largo plazo (estructurado) |
Amazon Aurora, Amazon DynamoDB, Amazon Neptune |
Datos, relaciones y registros |
A largo plazo (semántico) |
OpenSearch, PostgreSQL, Pinecone |
Recuperación basada en la incrustación (es decir, RAG) |
Almacenamiento |
Amazon S3 |
Almacenamiento de transcripciones, memorias estructuradas y archivos |
Orquestación |
AWS Lambda o bien AWS Step Functions |
Gestión del ciclo de vida de las inyecciones y actualizaciones de memoria |
Razonamiento |
Amazon Bedrock |
Claude o Mistral antrópicos con indicaciones de memoria |
Implementación de mensajes con inyección de memoria
Para integrar la memoria en el razonamiento de los agentes, utilice una combinación de estado estructurado e inyección de contexto con recuperación aumentada:
-
Incluya el estado más reciente del agente y el historial de diálogos recientes como entrada estructurada al crear el mensaje para el modelo lingüístico, de modo que pueda razonar con todo el contexto.
-
Utilice la generación de recuperación aumentada (RAG) para extraer documentos o hechos relevantes de la memoria a largo plazo.
-
Resuma los planes, el contexto y las interacciones anteriores para hacerlos más comprensivos y relevantes.
-
Inserte módulos de memoria externos, como almacenes vectoriales o registros estructurados, durante la inferencia para guiar la toma de decisiones.
Resumen
Los agentes con memoria aumentada mantienen la continuidad del pensamiento al aprender de la experiencia y recordar el contexto del usuario. Estos agentes superan la inteligencia reactiva al utilizar la colaboración a largo plazo, la personalización y el razonamiento estratégico. En términos de inteligencia artificial, la memoria permite a los agentes comportarse más como homólogos digitales adaptables y menos como herramientas apátridas.