Flusso di lavoro per il routing

Nel modello di routing, un classificatore o un agente router utilizza un LLM per interpretare l'intento o la categoria di una query, quindi indirizza l'input a un'attività o un agente downstream specializzato.

Il flusso di lavoro di routing viene utilizzato in scenari in cui un agente deve classificare rapidamente l'intento di input, il tipo di attività o il dominio e quindi delegare la richiesta a un subagente, uno strumento o un flusso di lavoro specializzato. È particolarmente utile negli agenti di funzionalità, come quelli che fungono da assistenti generali, nelle porte di accesso alle funzioni aziendali o nelle interfacce AI rivolte agli utenti che si estendono su più domini.

Il routing è particolarmente efficace quando:

Classificazione delle richieste per una serie di attività (ad esempio ricerca, riepilogo, prenotazione, calcoli).
Gli input devono essere preelaborati o normalizzati prima di accedere a flussi di lavoro più specializzati.
Tipi di input diversi (ad esempio, immagini anziché testo, query strutturate e non strutturate) richiedono una gestione personalizzata.
Un agente funge da centralino conversazionale, delegando attività ad agenti specializzati o microservizi.
Questo flusso di lavoro è comune nei copiloti specifici del dominio, nei bot di assistenza clienti, nei router di servizi aziendali e negli agenti multimodali, dove il dispacciamento intelligente determina sia la qualità che l'efficienza del comportamento degli agenti.

Funzionalità

Un LLM di primo passaggio funge da dispatcher
I percorsi possono richiamare flussi di lavoro distinti o persino altri modelli di agenti
Supporta l'espansione modulare delle funzionalità

Casi di utilizzo comune

Assistenti multidominio («è una questione legale, medica o finanziaria?»)
Alberi decisionali migliorati con il ragionamento LLM
Selezione dinamica degli strumenti (ad esempio, ricerca e generazione di codice)

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Flusso di lavoro per il concatenamento rapido

Flusso di lavoro per la parallelizzazione