Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Flusso di lavoro per il routing
Nel modello di routing, un classificatore o un agente router utilizza un LLM per interpretare l'intento o la categoria di una query, quindi indirizza l'input a un'attività o un agente downstream specializzato.
Il flusso di lavoro di routing viene utilizzato in scenari in cui un agente deve classificare rapidamente l'intento di input, il tipo di attività o il dominio e quindi delegare la richiesta a un subagente, uno strumento o un flusso di lavoro specializzato. È particolarmente utile negli agenti di funzionalità, come quelli che fungono da assistenti generali, nelle porte di accesso alle funzioni aziendali o nelle interfacce AI rivolte agli utenti che si estendono su più domini.
Il routing è particolarmente efficace quando:
-
Classificazione delle richieste per una serie di attività (ad esempio ricerca, riepilogo, prenotazione, calcoli).
-
Gli input devono essere preelaborati o normalizzati prima di accedere a flussi di lavoro più specializzati.
-
Tipi di input diversi (ad esempio, immagini anziché testo, query strutturate e non strutturate) richiedono una gestione personalizzata.
-
Un agente funge da centralino conversazionale, delegando attività ad agenti specializzati o microservizi.
-
Questo flusso di lavoro è comune nei copiloti specifici del dominio, nei bot di assistenza clienti, nei router di servizi aziendali e negli agenti multimodali, dove il dispacciamento intelligente determina sia la qualità che l'efficienza del comportamento degli agenti.
Funzionalità
-
Un LLM di primo passaggio funge da dispatcher
-
I percorsi possono richiamare flussi di lavoro distinti o persino altri modelli di agenti
-
Supporta l'espansione modulare delle funzionalità
Casi di utilizzo comune
-
Assistenti multidominio («è una questione legale, medica o finanziaria?»)
-
Alberi decisionali migliorati con il ragionamento LLM
-
Selezione dinamica degli strumenti (ad esempio, ricerca e generazione di codice)