Agentes baseados em ferramentas para servidores - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Agentes baseados em ferramentas para servidores

Agentes baseados em ferramentas para servidores aprimoram os agentes de chamada de funções delegando a execução da ferramenta a um servidor externo que tem um ambiente de tempo de execução dedicado para ferramentas, scripts e agentes compostos. Diferentemente das chamadas de função em linha que o loop do agente seleciona e invoca, os agentes baseados em servidor terceirizam a lógica e o pipeline de execução para outros agentes ou sistemas. Isso fornece recursos avançados, como encadeamento de várias ferramentas, execução isolada e raciocínio especializado. Os servidores de ferramentas são ideais para ações complexas, com estado ou que consomem muitos recursos, nas quais as próprias ferramentas podem envolver modelos de IA, regras de negócios ou ambientes separados.

Arquitetura

O seguinte é um padrão para agentes baseados em ferramentas para servidores:

Agentes baseados em ferramentas para servidores.

Description

  1. Recebe consulta

    • Um usuário ou sistema envia uma solicitação ao shell do agente.

    • O agente interpreta a consulta e se prepara para enviá-la para um servidor de ferramentas.

  2. Executa processos do servidor de ferramentas

    • O agente envia a tarefa, junto com os parâmetros estruturados, para um servidor de ferramentas.

    • O servidor de ferramentas pode então:

      • Execute scripts ou lógica em sistemas computacionais dedicados (por exemplo AWS Lambda, contêineres ou Amazon SageMaker)

      • Use seu próprio subagente com raciocínio LLM para selecionar e executar ferramentas

      • Gerencie dependências, novas tentativas ou fluxos de execução em várias etapas

      • Resultados de saída para o agente primário quando a tarefa estiver concluída

  3. Usa o raciocínio LLM com a saída da ferramenta

    • O agente invoca um LLM, transmitindo a consulta original e o resultado do servidor de ferramentas como parte do prompt.

    • O LLM sintetiza uma resposta que incorpora as informações recém-adquiridas.

  4. Retorna uma resposta

    • O agente retorna uma resposta estruturada ou em linguagem natural ao usuário ou ao sistema de chamada.

    • (Opcional) Os resultados podem ser armazenados na memória ou nos registros de auditoria.

Capacidades

  • As ferramentas são invocadas fora do ciclo de execução do agente primário

  • A execução da ferramenta pode envolver chamadas LLM, cadeias lógicas ou subagentes

  • O agente atua como um controlador ou despachante, não apenas como um invólucro de ferramentas

  • Permite composição, escalabilidade e isolamento da lógica

Casos de uso comuns

  • Orquestrando cadeias de modelos (por exemplo, combinando LLM, visão e código)

  • Pipelines de automação orientados por IA

  • DevOps agentes assistentes com roteiristas

  • Agentes complexos de computação financeira, simulação ou otimização

  • Ferramentas multimodais (por exemplo, combinando áudio, documentação e ação)

Orientação para implementação

Você pode criar esse padrão usando o seguinte Serviços da AWS:

  • Amazon Bedrock (agente, host e inferência de LLM)

  • AWS Lambda, Amazon ECS ou SageMaker endpoints da Amazon como tempo de execução do servidor de ferramentas AWS Fargate

  • Amazon API Gateway ou AWS App Runner para expor o servidor de ferramentas APIs

  • Amazon EventBridge para mensagens agent-to-tool desacopladas

  • AWS Step Functions ou AWS AppFabric para compor lógica multiagente no servidor de ferramentas

Resumo

Os agentes baseados em ferramentas que usam servidores são altamente modulares e escaláveis. Eles separam a lógica de decisão da execução, o que permite que o agente primário permaneça leve enquanto transfere ações complexas ou confidenciais para outros sistemas. Isso é importante para a IA agente de nível corporativo, especialmente em ambientes que exigem governança, observabilidade, isolamento, composição dinâmica ou qualquer combinação dos dois.