As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Padrões de despacho dinâmico de roteamento
Em sistemas agentes modernos, onde as tarefas variam da análise de documentos à geração autônoma de software, a capacidade de rotear solicitações dinamicamente para o modelo de linguagem grande (LLM) ou agente mais capaz se torna essencial. A lógica de roteamento estático, geralmente incorporada em scripts de orquestração ou camadas de API, carece da adaptabilidade necessária para ambientes em tempo real, com vários modelos e com vários recursos. Para resolver isso, os fluxos de trabalho de roteamento do LLM podem ser transformados em uma arquitetura orientada a eventos que aproveita um padrão de despacho dinâmico, transformando as chamadas do LLM em eventos roteados de forma inteligente e sensíveis ao contexto.
O diagrama a seguir é um exemplo de roteamento LLM:
Despacho dinâmico
Em sistemas distribuídos tradicionais, o padrão de despacho dinâmico seleciona e invoca serviços específicos em tempo de execução com base nos atributos de eventos de entrada, como tipo de evento, origem e carga útil. Isso geralmente é implementado usando a Amazon EventBridge, que pode avaliar e rotear eventos recebidos para destinos apropriados (por exemplo AWS Step Functions, AWS Lambda funções ou tarefas do Amazon Elastic Container Service).
O diagrama a seguir é um exemplo de despacho dinâmico:
-
Um aplicativo emite um evento (por exemplo, {"type”: “orderCreated”, “priority”: “high"}).
-
A Amazon EventBridge avalia o evento de acordo com suas regras de roteamento.
-
Com base nos atributos de um evento, o sistema envia dinamicamente para o seguinte:
-
HighPriorityOrderProcessor(serviço A) -
StandardOrderProcessor(serviço B) -
UpdateOrderProcessor(serviço C)
-
Esse padrão oferece suporte a acoplamento frouxo, especialização baseada em domínio e extensibilidade de tempo de execução. Isso permite que os sistemas respondam de forma inteligente às mudanças nos requisitos e na semântica dos eventos.
Roteamento baseado em LLM
Em sistemas agentes, o roteamento também executa a delegação dinâmica de tarefas — mas, em vez EventBridge das regras ou filtros de metadados da Amazon, o LLM classifica e interpreta a intenção do usuário por meio da linguagem natural. O resultado é uma forma de despacho flexível, semântica e adaptável.
Roteador de agente
Essa arquitetura permite um envio rico baseado em intenção sem esquemas ou tipos de eventos predefinidos, o que é ideal para entradas não estruturadas e consultas complexas.
-
Um usuário envia a solicitação “Você pode me ajudar a revisar os termos do meu contrato?”
-
O LLM interpreta isso como uma tarefa de documento legal.
-
O agente encaminha a tarefa para uma ou mais das seguintes opções:
-
Modelo de solicitação de revisão de contrato
-
Subagente de raciocínio jurídico
-
Ferramenta de análise de documentos
-
O diagrama a seguir é um exemplo de um roteador de agente:
-
Um usuário envia uma solicitação de linguagem natural por meio de um SDK.
-
Um agente do Amazon Bedrock usa um LLM para classificar a tarefa (por exemplo, jurídica, técnica ou agendamento).
-
O agente roteia dinamicamente a tarefa por meio de um grupo de ações para invocar o agente necessário:
-
Agente específico de domínio
-
Cadeia de ferramentas especializada
-
Configuração de prompt personalizada
-
-
O manipulador selecionado processa a tarefa e retorna uma resposta personalizada.
Takeaways
Enquanto o despacho dinâmico tradicional usa EventBridge as regras da Amazon para roteamento com base em atributos de eventos estruturados, o roteamento agente usa LLMs para classificar e rotear semanticamente as tarefas com base no significado e na intenção. Isso expande a flexibilidade do sistema ao permitir o seguinte:
-
Compreensão mais ampla dos insumos
-
Recuo inteligente e seleção de ferramentas
-
Extensibilidade natural por meio de novas funções de agente ou estilos de solicitação
O roteamento agente substitui regras rígidas pelo despacho cognitivo dinâmico, o que permite que os sistemas evoluam com a linguagem e não com o código.