O avaliador reflete e refina os padrões de loop - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O avaliador reflete e refina os padrões de loop

Tarefas como geração de código, resumo ou tomada de decisão autônoma se beneficiam muito do feedback de tempo de execução, permitindo que o sistema evolua por meio de observação e refinamento. Para operacionalizar isso, o ciclo reflect-refine pode ser implementado como um circuito de controle de feedback orientado por eventos — um padrão inspirado na engenharia de sistemas, adaptado para fluxos de trabalho autônomos e inteligentes.

O diagrama a seguir é um exemplo de um ciclo de feedback de reflexão e refinamento do avaliador:

O avaliador reflete e refina o ciclo de feedback.

Circuito de controle de feedback

Um loop de controle de feedback é um padrão que monitora suas próprias saídas e comportamentos, os avalia em relação a critérios definidos ou a um estado desejado e, em seguida, ajusta suas ações de acordo. Essa arquitetura é inspirada na teoria de controle e é fundamental em domínios como automação, pipelines de integração e entrega contínuas (CI/CD) e operações de aprendizado de máquina.

O diagrama a seguir é um exemplo de um circuito de controle de feedback:

Circuito de controle de feedback.
  1. Um pipeline de implantação emite um evento BuildComplete.

  2. O evento aciona um teste automatizado ou um trabalho de avaliação que valida a compilação.

  3. Se a validação falhar (por exemplo, devido a falhas nos testes, problemas de segurança ou violação da política), o sistema:

    • Emite um evento BuildComplete

    • Registra o problema ou envia uma notificação

    • Aciona uma ação corretiva ou de remediação, como reversão, aplicação de patches ou nova tentativa

O ciclo continua até produzir um resultado ou escalonamento aceitável, ou até que ocorra um tempo limite. Esse padrão é comumente usado para o seguinte:

  • EventBridge Regras da Amazon para encaminhar eventos para tarefas de avaliação ou remediação

  • AWS Step Functions para lógica de repetição iterativa e ramificação dos resultados da avaliação

  • Amazon Simple Notification Service (Amazon SNS) ou alarmes da Amazon para CloudWatch acionadores e alertas de feedback

  • AWS Lambda funções ou trabalhadores em contêineres para aplicar ações corretivas

Circuito de controle de feedback (avaliador)

O fluxo de trabalho do avaliador é um ciclo de feedback cognitivo desenvolvido por nossos agentes LLMs de raciocínio. O processo consiste no seguinte:

  1. Um agente gerador ou LLM produz uma saída (por exemplo, um plano, uma resposta ou um rascunho).

  2. Um agente avaliador analisa o resultado usando um aviso de crítica ou uma rubrica de avaliação.

  3. Com base no feedback, o agente original ou um novo agente otimizador revisa a saída.

O loop se repete até que o resultado atenda a um conjunto de critérios, seja aprovado ou atinja um limite de repetição.

Avaliador

  1. Um usuário pede que um agente escreva um resumo da política.

  2. O agente gerador o elabora.

  3. Um agente avaliador verifica a cobertura, o tom e a correção legal.

  4. Se a resposta for inadequada, ela será refinada e reenviada até que o ciclo de feedback converja.

Isso permite a autoavaliação, o refinamento iterativo e o controle de saída adaptativo, tudo sem a intervenção humana.

O diagrama a seguir é um exemplo de um circuito de controle de feedback (avaliador):

Circuito de controle de feedback (avaliador).
  1. Um usuário emite uma tarefa (por exemplo, elabore uma estratégia de negócios).

  2. Um agente do Amazon Bedrock gera um rascunho inicial usando um LLM.

  3. Um segundo agente (ou uma solicitação de acompanhamento) realiza uma avaliação estruturada (por exemplo, “classifique essa saída por clareza, integridade e tom”).

  4. Se a classificação cair abaixo de um limite, a resposta será revisada por:

    • Reinvocando o gerador com uma crítica incorporada

    • Enviando o feedback para um agente refinador especializado

    • Iterando até que uma resposta aceitável seja alcançada

Componentes opcionais, como AWS Lambda controladores, AWS Step Functions podem gerenciar limites de feedback, novas tentativas e estratégias alternativas.

Takeaways

Enquanto os ciclos tradicionais de controle de feedback usam eventos, métricas e lógica de remediação para validar e ajustar o comportamento do sistema, os loops avaliadores agentes usam agentes de raciocínio para avaliar, refletir e revisar a saída dinamicamente.

Em ambos os paradigmas:

  • A saída é avaliada após ser gerada

  • Ações corretivas ou de refinamento são acionadas com base no feedback

  • O sistema se adapta continuamente a uma meta ou qualidade alvo

A versão agente transforma a validação estática em reflexão semântica, permitindo que agentes de autoaperfeiçoamento avaliem sua própria eficácia.