El evaluador refleja y refina los patrones de bucles - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

El evaluador refleja y refina los patrones de bucles

Las tareas como la generación de código, el resumen o la toma de decisiones autónoma se benefician en gran medida de la retroalimentación en tiempo de ejecución, lo que permite que el sistema evolucione mediante la observación y el perfeccionamiento. Para ponerlo en práctica, el ciclo de reflexión y refinamiento se puede implementar como un circuito de control de retroalimentación basado en eventos, un patrón inspirado en la ingeniería de sistemas y adaptado a flujos de trabajo autónomos e inteligentes.

El siguiente diagrama es un ejemplo de un circuito de retroalimentación entre reflexión y refinamiento del evaluador:

El evaluador refleja y refina el ciclo de retroalimentación.

Bucle de control de retroalimentación

Un circuito de control de retroalimentación es un patrón que monitorea sus propios resultados y comportamientos, los evalúa en función de criterios definidos o de un estado deseado y, a continuación, ajusta sus acciones en consecuencia. Esta arquitectura se inspira en la teoría del control y es fundamental en ámbitos como la automatización, los procesos de integración y entrega continuas (CI/CD) y las operaciones de aprendizaje automático.

El siguiente diagrama es un ejemplo de un circuito de control de retroalimentación:

Bucle de control de retroalimentación.
  1. Una canalización de despliegue emite un evento BuildComplete.

  2. El evento desencadena un trabajo de prueba o evaluación automatizado que valida la compilación.

  3. Si la validación falla (por ejemplo, debido a pruebas fallidas, problemas de seguridad o una infracción de una política), el sistema:

    • Emite un evento BuildComplete

    • Registra el problema o envía una notificación

    • Activa una acción correctiva o correctiva, como revertirla, parchearla o volver a intentarlo

El ciclo continúa hasta que produce un resultado o una escalada aceptables, o hasta que se agota el tiempo de espera. Este patrón se suele utilizar para lo siguiente:

  • EventBridge Reglas de Amazon para dirigir los eventos a tareas de evaluación o corrección

  • AWS Step Functions para la lógica de reintentos iterativos y la ramificación de los resultados de la evaluación

  • Amazon Simple Notification Service (Amazon SNS) o alarmas de CloudWatch Amazon para activar comentarios y alertas

  • AWS Lambda funciones o trabajadores agrupados en contenedores para aplicar medidas correctivas

Bucle de control de retroalimentación (evaluador)

El flujo de trabajo de un evaluador es un circuito de retroalimentación cognitiva impulsado por agentes LLMs de razonamiento. El proceso consiste en lo siguiente:

  1. Un agente generador o LLM produce un resultado (por ejemplo, un plan, una respuesta o un borrador).

  2. Un agente evaluador revisa el resultado utilizando una guía de crítica o una rúbrica de evaluación.

  3. En función de los comentarios, el agente original o un nuevo agente optimizador revisan el resultado.

El ciclo se repite hasta que el resultado cumpla una serie de criterios, se apruebe o alcance un límite de reintentos.

Evaluador

  1. Un usuario le pide a un agente que redacte un resumen de la política.

  2. El agente generador lo redacta.

  3. Un agente evaluador comprueba la cobertura, el tono y la corrección legal.

  4. Si la respuesta es inadecuada, se refina y se vuelve a enviar hasta que converja el ciclo de retroalimentación.

Esto permite la autoevaluación, el refinamiento iterativo y el control adaptativo de los resultados, todo ello sin intervención humana.

El siguiente diagrama es un ejemplo de un circuito de control de retroalimentación (evaluador):

Bucle de control de retroalimentación (evaluador).
  1. Un usuario emite una tarea (por ejemplo, redactar una estrategia empresarial).

  2. Un agente de Amazon Bedrock genera un borrador inicial mediante un LLM.

  3. Un segundo agente (o un agente de seguimiento) realiza una evaluación estructurada (por ejemplo, «califica este resultado según su claridad, integridad y tono»).

  4. Si la calificación cae por debajo de un umbral, la respuesta se revisa de la siguiente manera:

    • Reinvocar el generador con una crítica incrustada

    • Enviar los comentarios a un agente refinador especializado

    • Iterando hasta alcanzar una respuesta aceptable

Los componentes opcionales, como AWS Lambda los controladores, AWS Step Functions pueden gestionar los umbrales de retroalimentación, los reintentos y las estrategias alternativas.

Conclusiones

Mientras que los bucles de control de retroalimentación tradicionales utilizan eventos, métricas y lógica de remediación para validar y ajustar el comportamiento del sistema, los bucles de evaluación de los agentes utilizan agentes de razonamiento para evaluar, reflejar y revisar los resultados de forma dinámica.

En ambos paradigmas:

  • La salida se evalúa después de generarse

  • Las acciones correctivas o de refinamiento se activan en función de los comentarios

  • El sistema se adapta continuamente a un objetivo, calidad u objetivo

La versión agencial transforma la validación estática en reflexión semántica, lo que permite a los agentes que se mejoran a sí mismos evaluar su propia eficacia.