Flusso di lavoro per il routing - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Flusso di lavoro per il routing

Nel modello di routing, un classificatore o un agente router utilizza un LLM per interpretare l'intento o la categoria di una query, quindi indirizza l'input a un'attività o un agente downstream specializzato.

Flusso di lavoro per il routing.

Il flusso di lavoro di routing viene utilizzato in scenari in cui un agente deve classificare rapidamente l'intento di input, il tipo di attività o il dominio e quindi delegare la richiesta a un subagente, uno strumento o un flusso di lavoro specializzato. È particolarmente utile negli agenti di funzionalità, come quelli che fungono da assistenti generali, nelle porte di accesso alle funzioni aziendali o nelle interfacce AI rivolte agli utenti che si estendono su più domini.

Il routing è particolarmente efficace quando:

  • Classificazione delle richieste per una serie di attività (ad esempio ricerca, riepilogo, prenotazione, calcoli).

  • Gli input devono essere preelaborati o normalizzati prima di accedere a flussi di lavoro più specializzati.

  • Tipi di input diversi (ad esempio, immagini anziché testo, query strutturate e non strutturate) richiedono una gestione personalizzata.

  • Un agente funge da centralino conversazionale, delegando attività ad agenti specializzati o microservizi.

  • Questo flusso di lavoro è comune nei copiloti specifici del dominio, nei bot di assistenza clienti, nei router di servizi aziendali e negli agenti multimodali, dove il dispacciamento intelligente determina sia la qualità che l'efficienza del comportamento degli agenti.

Funzionalità

  • Un LLM di primo passaggio funge da dispatcher

  • I percorsi possono richiamare flussi di lavoro distinti o persino altri modelli di agenti

  • Supporta l'espansione modulare delle funzionalità

Casi di utilizzo comune

  • Assistenti multidominio («è una questione legale, medica o finanziaria?»)

  • Alberi decisionali migliorati con il ragionamento LLM

  • Selezione dinamica degli strumenti (ad esempio, ricerca e generazione di codice)