Fluxo de trabalho para roteamento

No padrão de roteamento, um classificador ou agente de roteador usa um LLM para interpretar a intenção ou a categoria de uma consulta e, em seguida, encaminha a entrada para uma tarefa ou agente downstream especializado.

O fluxo de trabalho de roteamento é usado em cenários em que um agente deve classificar rapidamente a intenção de entrada, o tipo de tarefa ou o domínio e, em seguida, delegar a solicitação a um subagente, ferramenta ou fluxo de trabalho especializado. É especialmente útil em agentes capacitados, como aqueles que atuam como assistentes gerais, portas de entrada para funções corporativas ou interfaces de IA voltadas para o usuário que abrangem domínios.

O roteamento é particularmente eficaz quando:

Triagem de solicitações em uma variedade de tarefas (por exemplo, pesquisa, resumo, agendamento, cálculos).
As entradas devem ser pré-processadas ou normalizadas antes de entrar em fluxos de trabalho mais especializados.
Diferentes tipos de entrada (por exemplo, imagens versus texto, consultas estruturadas versus consultas não estruturadas) exigem tratamento personalizado.
Um agente está atuando como uma central telefônica conversacional, delegando tarefas a agentes especializados ou microsserviços.
Esse fluxo de trabalho é comum em copilotos específicos de domínio, bots de suporte ao cliente, roteadores de serviços corporativos e agentes multimodais, nos quais o despacho inteligente determina a qualidade e a eficiência do comportamento do agente.

Capacidades

Um LLM de primeira passagem atua como despachante
As rotas podem invocar fluxos de trabalho distintos ou até mesmo outros padrões de agentes
Oferece suporte à expansão modular dos recursos

Casos de uso comuns

Assistentes de vários domínios (“essa é uma questão legal, médica ou financeira?”)
Árvores de decisão aprimoradas com o raciocínio LLM
Seleção dinâmica de ferramentas (por exemplo, pesquisa versus geração de código)

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Fluxo de trabalho para encadeamento imediato

Fluxo de trabalho para paralelização