Padrão 5: fluxo de trabalho de IA do Grounded Agent - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Padrão 5: fluxo de trabalho de IA do Grounded Agent

Modelos de linguagem grandes (LLMs) são poderosos, mas são ilimitados por padrão. Eles não conhecem dados proprietários, regras de negócios ou restrições operacionais, o que os torna arriscados para a interação direta com usuários ou sistemas.

As empresas enfrentam os seguintes desafios comuns:

  • LLMs alucinam quando não sabem a resposta, o que representa riscos à confiança e à conformidade.

  • As respostas não têm base em fatos, políticas ou estados em tempo real específicos do domínio (por exemplo, pedidos, contas e direitos).

  • A automação dinâmica de tarefas (por exemplo, pesquisas de pedidos, triagem de suporte e operações de TI) geralmente exige a invocação de ferramentas APIs e ferramentas reais, não apenas a geração de texto.

  • Criar roteadores de intenção tradicionais, gerenciadores de diálogo e fluxos baseados em regras é caro, frágil e não escalável.

Para enfrentar esses desafios, as empresas querem agentes que raciocinem de forma inteligente, ajam de forma autônoma e permaneçam fundamentados na realidade.

O fluxo de trabalho de IA do agente fundamentado: inteligência autônoma com confiança e contexto

O padrão de fluxo de trabalho de IA do agente fundamentado usa o Amazon Bedrock Agents para orquestrar o raciocínio semântico, a invocação de ferramentas e a fundamentação do conhecimento. Os agentes permitem que os assistentes de IA recebam informações do usuário, entendam a intenção e concluam tarefas de várias etapas usando empresas APIs e documentos.

Ao contrário dos chatbots simples ou dos prompts estáticos do LLM, os agentes do Amazon Bedrock:

  • Interprete os objetivos da linguagem natural.

  • Selecione e invoque ferramentas (usando AWS Lambda funções) dinamicamente.

  • Pesquise ou consulte bases de conhecimento para se manter fundamentado na verdade corporativa.

  • Retorne respostas contextuais de várias etapas com rastreabilidade e capacidade de ação.

A arquitetura de referência implementa cada camada da seguinte forma:

  • Acionador de evento — usa o Amazon API Gateway, a interface do chatbot ou o portal de suporte para acionar a interação do agente por meio do Amazon Bedrock

  • Processamento — implementa o Lambda para formatar entradas, aplicar contexto de segurança (por exemplo, funções ou direitos de usuário) e enriquecer metadados

  • Inferência — usa o agente Amazon Bedrock para receber a solicitação, invocar ferramentas Lambda (por exemplogetOrderStatus,), realizar a fundamentação por meio de uma base de conhecimento e montar uma resposta final

  • Pós-processamento — usa o Lambda para inspecionar a saída do agente (por exemplo, escalar se o “pedido for perdido” e notificar a equipe de suporte)

  • Saída — Retorna a resposta do agente à interface do usuário ou a registra no Amazon Simple Storage Service (Amazon S3) ou no Amazon OpenSearch Service para auditoria, treinamento ou análise

Caso de uso: agente de atendimento ao cliente de varejo

Um varejista global quer automatizar as respostas às perguntas comuns dos clientes, como: “Onde está meu pedido?” , “Quero devolver esses sapatos. “e “Preciso pagar pelo frete de devolução?”

As respostas dependem de fatores como os dados do pedido em tempo real do cliente, a elegibilidade e os prazos de devolução e as políticas específicas da região.

Em resposta a esse caso de uso, o fluxo de trabalho baseado em agente segue estas etapas:

  1. O usuário insere sua consulta usando um aplicativo ou chat.

  2. O API Gateway encaminha a consulta para o agente Amazon Bedrock.

  3. O agente executa as seguintes ações:

    • Analisa a intenção (“solicitação de devolução”)

    • Invoca uma ferramenta Lambda lookupOrderStatus

    • Executa uma pesquisa de políticas por meio da base de conhecimento

    • Ligue initiateReturn se for elegível

    • Compõe uma resposta completa: “Sua devolução foi iniciada. Espere receber uma etiqueta em uma mensagem de e-mail.”

Todas as ações são fundamentadas, registradas e executadas dentro das barreiras corporativas.

Principais características dos Amazon Bedrock Agents nesse padrão

Para o padrão de fluxo de trabalho de IA do agente fundamentado, os agentes do Amazon Bedrock fornecem os seguintes recursos e benefícios principais:

  • A seleção de ferramentas permite que um agente escolha a função (ferramenta) Lambda correta para cada tarefa.

  • A memória e o estado da sessão permitem que os agentes mantenham o contexto em todos os turnos.

  • As respostas fundamentadas recuperam dados confiáveis de bases de conhecimento armazenadas no Amazon S3.

  • O raciocínio da cadeia de pensamento (CoT) permite que um agente decomponha solicitações complexas em subobjetivos e aja sequencialmente.

  • O contexto de segurança permite que as ferramentas tenham o escopo definido de acordo com o locatário, o usuário ou a função usando AWS Identity and Access Management (IAM) e parâmetros contextuais.

Melhores práticas de governança e controles para o padrão de fluxo de trabalho de IA do agente fundamentado

Para tornar os fluxos de trabalho de IA de agentes fundamentados prontos para uso corporativo, as organizações devem considerar os seguintes controles:

  • Configurações do agente de controle de versão (por exemplo, ferramentas, instruções e bases de conhecimento).

  • Use registros e rastreamento estruturados IDs para fins de auditoria.

  • Aplique políticas imediatas, listas de permissões e verificações de moderação.

  • Defina fluxos alternativos (por exemplo, escalar para perguntas frequentes humanas ou redirecionar para perguntas frequentes estáticas).

Esses controles podem ser orquestrados usando o Lambda e em AWS Step Functionstorno do EventBridge núcleo do agente.

Valor comercial do padrão de fluxo de trabalho de IA do agente fundamentado

Esse padrão agrega valor nas seguintes áreas:

  • Experiência do cliente — permite a resolução por autoatendimento para 70 a 80 por cento das consultas sem escalonamento

  • Eficiência operacional — reduz o volume de tíquetes de suporte e a sobrecarga de triagem

  • Tempo de resolução — fornece respostas instantâneas usando dados reais, sem esperar por agentes humanos

  • Escalabilidade — Lida com milhares de interações simultâneas sem aumentar o número de funcionários humanos

  • Reutilização entre domínios — aplica o mesmo padrão a vários domínios, como suporte de TI, suporte técnico de RH, perguntas e respostas jurídicas e muito mais

O fluxo de trabalho de IA do agente fundamentado permite que as empresas avancem além das perguntas e respostas estáticas e adotem a automação orientada por metas, sem sacrificar o controle, a conformidade ou a precisão. Ao combinar o raciocínio do LLM com a execução segura e sem servidor da API e a recuperação de conhecimento, os Amazon Bedrock Agents oferecem recursos de IA que agem, não apenas respondem.

O agente aterrado é a arquitetura de interação empresarial inteligente, modular, fundamentada e pronta para ser escalada.