Fluxo de trabalho para roteamento - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Fluxo de trabalho para roteamento

No padrão de roteamento, um classificador ou agente de roteador usa um LLM para interpretar a intenção ou a categoria de uma consulta e, em seguida, encaminha a entrada para uma tarefa ou agente downstream especializado.

Fluxo de trabalho para roteamento.

O fluxo de trabalho de roteamento é usado em cenários em que um agente deve classificar rapidamente a intenção de entrada, o tipo de tarefa ou o domínio e, em seguida, delegar a solicitação a um subagente, ferramenta ou fluxo de trabalho especializado. É especialmente útil em agentes capacitados, como aqueles que atuam como assistentes gerais, portas de entrada para funções corporativas ou interfaces de IA voltadas para o usuário que abrangem domínios.

O roteamento é particularmente eficaz quando:

  • Triagem de solicitações em uma variedade de tarefas (por exemplo, pesquisa, resumo, agendamento, cálculos).

  • As entradas devem ser pré-processadas ou normalizadas antes de entrar em fluxos de trabalho mais especializados.

  • Diferentes tipos de entrada (por exemplo, imagens versus texto, consultas estruturadas versus consultas não estruturadas) exigem tratamento personalizado.

  • Um agente está atuando como uma central telefônica conversacional, delegando tarefas a agentes especializados ou microsserviços.

  • Esse fluxo de trabalho é comum em copilotos específicos de domínio, bots de suporte ao cliente, roteadores de serviços corporativos e agentes multimodais, nos quais o despacho inteligente determina a qualidade e a eficiência do comportamento do agente.

Capacidades

  • Um LLM de primeira passagem atua como despachante

  • As rotas podem invocar fluxos de trabalho distintos ou até mesmo outros padrões de agentes

  • Oferece suporte à expansão modular dos recursos

Casos de uso comuns

  • Assistentes de vários domínios (“essa é uma questão legal, médica ou financeira?”)

  • Árvores de decisão aprimoradas com o raciocínio LLM

  • Seleção dinâmica de ferramentas (por exemplo, pesquisa versus geração de código)