Arquitectura de agentes tradicional: percibir, razonar, actuar - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Arquitectura de agentes tradicional: percibir, razonar, actuar

El siguiente diagrama ilustra cómo funcionan los componentes básicos analizados en la sección anterior en el ciclo de percibir, razonar y actuar.

Cómo se aplican los componentes básicos a la arquitectura de agentes tradicional.

Módulo Percibe

El módulo de percepción actúa como interfaz sensorial del agente con el mundo externo. Transforma la información ambiental cruda en representaciones estructuradas que informan el razonamiento. Esto incluye el manejo de datos multimodales, como texto, audio o señales de sensores.

  • La entrada de texto puede provenir de comandos, documentos o diálogos del usuario.

  • La entrada de audio incluye instrucciones habladas o sonidos ambientales.

  • La entrada del sensor captura señales del mundo real, como el movimiento, las señales visuales o el GPS.

Una vez ingerida la información sin procesar, el proceso de percepción consiste en extraer las características y, a continuación, reconocer objetos o eventos e interpretarlos semánticamente para crear un modelo significativo de la situación actual. Estos resultados proporcionan un contexto estructurado para la toma de decisiones posteriores y anclan el razonamiento del agente en las observaciones del mundo real.

Módulo de motivos

El módulo de la razón es el núcleo cognitivo del agente. Evalúa el contexto, formula la intención y determina las acciones apropiadas. Este módulo organiza el comportamiento impulsado por objetivos utilizando tanto el conocimiento aprendido como el razonamiento.

El módulo Reason consta de submódulos estrechamente integrados:

  • Memoria: mantiene el estado del diálogo, el contexto de la tarea y el historial episódico tanto a corto como a largo plazo.

  • Base de conocimientos: proporciona acceso a reglas simbólicas, ontologías o modelos aprendidos (como incrustaciones, hechos y políticas).

  • Objetivos y planes: define los resultados deseados y elabora estrategias de acción para lograrlos. Los objetivos se pueden actualizar de forma dinámica y los planes se pueden modificar de forma adaptativa en función de los comentarios.

  • Toma de decisiones: actúa como el motor central de arbitraje al sopesar las opciones, evaluar las compensaciones y seleccionar la siguiente acción. Este submódulo tiene en cuenta los umbrales de confianza, la alineación de los objetivos y las restricciones contextuales.

Juntos, estos componentes permiten al agente razonar sobre su entorno, actualizar sus creencias, seleccionar caminos y comportarse de manera coherente y adaptativa. El módulo de la razón cierra la brecha entre la percepción y el comportamiento.

Módulo Act

El módulo act ejecuta la decisión seleccionada por el agente mediante una interfaz con el entorno digital o físico para llevar a cabo las tareas. Aquí es donde la intención se convierte en acción.

Este módulo incluye tres canales funcionales:

  • Actuadores: para los agentes que tienen presencia física (como robots y dispositivos de IoT), controlan las interacciones a nivel de hardware, como el movimiento, la manipulación o la señalización.

  • Ejecución: gestiona las acciones basadas en el software, como la invocación, el envío de comandos y la actualización de APIs los sistemas.

  • Herramientas: habilita funciones funcionales como la búsqueda, el resumen, la ejecución de código, el cálculo y la gestión de documentos. Estas herramientas suelen ser dinámicas y sensibles al contexto, lo que amplía la utilidad del agente.

Las salidas del módulo act se retroalimentan al entorno y cierran el ciclo. El agente vuelve a percibir estos resultados. Actualizan el estado interno del agente e informan las decisiones futuras, completando así el ciclo de percibir, razonar y actuar.