Evaluator Reflect-Refine Loop Patterns - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Evaluator Reflect-Refine Loop Patterns

Attività come la generazione di codice, il riepilogo o il processo decisionale autonomo traggono grandi vantaggi dal feedback in fase di esecuzione, che consente al sistema di evolversi attraverso l'osservazione e il perfezionamento. Per renderlo operativo, il ciclo reflect-refine può essere implementato come un circuito di controllo del feedback basato sugli eventi, un modello ispirato all'ingegneria dei sistemi, adattato per flussi di lavoro autonomi e intelligenti.

Il diagramma seguente è un esempio di ciclo di feedback reflect-refine di Evaluator:

Loop di feedback Reflect-Refine del valutatore.

Circuito di controllo del feedback

Un circuito di controllo del feedback è uno schema che monitora i propri output e comportamenti, li valuta in base a criteri definiti o allo stato desiderato e quindi regola le proprie azioni di conseguenza. Questa architettura si ispira alla teoria del controllo ed è fondamentale in domini come le pipeline di automazione, integrazione continua e distribuzione continua (CI/CD) e le operazioni di apprendimento automatico.

Il diagramma seguente è un esempio di circuito di controllo del feedback:

Circuito di controllo del feedback.
  1. Una pipeline di distribuzione emette un evento BuildComplete.

  2. L'evento attiva un processo di test o valutazione automatizzato che convalida la build.

  3. Se la convalida fallisce (ad esempio, a causa di test non riusciti, problemi di sicurezza o violazione delle politiche), il sistema:

    • Emette un evento BuildComplete

    • Registra il problema o invia una notifica

    • Attiva un'azione riparativa o correttiva, ad esempio il rollback, l'applicazione di una patch o un nuovo tentativo

Il ciclo continua finché non produce un risultato o un'escalation accettabile o fino a quando non si verifica un timeout. Questo modello viene comunemente utilizzato per quanto segue:

  • EventBridge Regole di Amazon per indirizzare gli eventi alle attività di valutazione o riparazione

  • AWS Step Functions per una logica di ripetizione iterativa e una ramificazione dei risultati della valutazione

  • Amazon Simple Notification Service (Amazon SNS) o allarmi Amazon per i trigger di CloudWatch feedback e gli avvisi

  • AWS Lambda funzioni o lavoratori containerizzati per applicare azioni correttive

Circuito di controllo del feedback (valutatore)

Il flusso di lavoro di un valutatore è un ciclo di feedback cognitivo alimentato dai nostri agenti di LLMs ragionamento. Il processo è costituito dai seguenti elementi:

  1. Un agente generatore o LLM produce un output (ad esempio, un piano, una risposta o una bozza).

  2. Un agente valutatore esamina il risultato utilizzando un prompt di critica o una rubrica di valutazione.

  3. In base al feedback, l'agente originale o un nuovo agente di ottimizzazione rivede l'output.

Il ciclo si ripete finché il risultato non soddisfa una serie di criteri, non viene approvato o raggiunge un limite di tentativi.

Valutatore

  1. Un utente chiede a un agente di scrivere un riepilogo delle politiche.

  2. L'agente generatore lo redige.

  3. Un agente valutatore verifica la copertura, il tono e la correttezza legale.

  4. Se la risposta è inadeguata, viene perfezionata e inviata nuovamente fino alla convergenza del ciclo di feedback.

Ciò consente l'autovalutazione, il perfezionamento iterativo e il controllo adattivo dell'output, il tutto senza l'intervento umano.

Il diagramma seguente è un esempio di circuito di controllo del feedback (valutatore):

Circuito di controllo del feedback (valutatore).
  1. Un utente esegue un'attività (ad esempio, redigere una strategia aziendale).

  2. Un agente Amazon Bedrock genera una bozza iniziale utilizzando un LLM.

  3. Un secondo agente (o un prompt di follow-up) esegue una valutazione strutturata (ad esempio, «valuta questo risultato in base a chiarezza, completezza e tono»).

  4. Se la valutazione scende al di sotto di una soglia, la risposta viene modificata da:

    • Reinvocare il generatore con una critica incorporata

    • Invio del feedback a un agente di raffinazione specializzato

    • Iterazione fino al raggiungimento di una risposta accettabile

Componenti opzionali come AWS Lambda i controller AWS Step Functions possono gestire soglie di feedback, nuovi tentativi e strategie di fallback.

Cose da asporto

Laddove i tradizionali circuiti di controllo del feedback utilizzano eventi, metriche e logica di correzione per convalidare e regolare il comportamento del sistema, i loop di valutazione agentica utilizzano agenti di ragionamento per valutare, riflettere e rivedere l'output in modo dinamico.

In entrambi i paradigmi:

  • L'output viene valutato dopo essere stato generato

  • Le azioni correttive o di perfezionamento vengono attivate in base al feedback

  • Il sistema si adatta continuamente alla qualità o all'obiettivo prefissato

La versione agentica trasforma la convalida statica in riflessione semantica, permettendo agli agenti di automiglioramento di valutare la propria efficacia.