Arquitetura tradicional de agentes: perceber, raciocinar, agir - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Arquitetura tradicional de agentes: perceber, raciocinar, agir

O diagrama a seguir ilustra como os blocos de construção discutidos na seção anterior operam sob o ciclo de perceber, raciocinar e agir.

Como os principais componentes se aplicam à arquitetura tradicional de agentes.

Módulo Perceber

O módulo de percepção atua como a interface sensorial do agente com o mundo externo. Ele transforma a entrada ambiental bruta em representações estruturadas que informam o raciocínio. Isso inclui lidar com dados multimodais, como texto, áudio ou sinais de sensores.

  • A entrada de texto pode vir de comandos, documentos ou diálogos do usuário.

  • A entrada de áudio inclui instruções faladas ou sons ambientais.

  • A entrada do sensor captura sinais do mundo real, como movimento, feeds visuais ou GPS.

Quando a entrada bruta é ingerida, o processo de percepção realiza a extração de características, seguida pelo reconhecimento de objetos ou eventos e interpretação semântica para criar um modelo significativo da situação atual. Esses resultados fornecem contexto estruturado para a tomada de decisões posteriores e ancoram o raciocínio do agente em observações do mundo real.

Módulo Reason

O módulo reason é o núcleo cognitivo do agente. Ele avalia o contexto, formula a intenção e determina as ações apropriadas. Este módulo orquestra o comportamento orientado por metas usando tanto o conhecimento aprendido quanto o raciocínio.

O módulo Reason consiste em submódulos totalmente integrados:

  • Memória: mantém o estado do diálogo, o contexto da tarefa e o histórico episódico nos formatos de curto e longo prazo.

  • Base de conhecimento: fornece acesso a regras simbólicas, ontologias ou modelos aprendidos (como incorporações, fatos e políticas).

  • Metas e planos: define os resultados desejados e constrói estratégias de ação para alcançá-los. As metas podem ser atualizadas dinamicamente e os planos podem ser modificados de forma adaptativa com base no feedback.

  • Tomada de decisão: atua como o mecanismo central de arbitragem, ponderando as opções, avaliando as compensações e selecionando a próxima ação. Esse submódulo leva em consideração os limites de confiança, o alinhamento de metas e as restrições contextuais.

Juntos, esses componentes permitem que o agente raciocine sobre seu ambiente, atualize crenças, selecione caminhos e se comporte de maneira coerente e adaptativa. O módulo de razão fecha a lacuna entre percepção e comportamento.

Módulo Act

O módulo act executa a decisão selecionada pelo agente por meio da interface com o ambiente digital ou físico para realizar tarefas. É aqui que a intenção se torna ação.

Este módulo inclui três canais funcionais:

  • Atuadores: para agentes que têm presença física (como robôs e dispositivos de IoT), controlam as interações em nível de hardware, como movimento, manipulação ou sinalização.

  • Execução: manipula ações baseadas em software, incluindo invocação APIs, envio de comandos e atualização de sistemas.

  • Ferramentas: permite recursos funcionais, como pesquisa, resumo, execução de código, cálculo e manuseio de documentos. Essas ferramentas geralmente são dinâmicas e sensíveis ao contexto, o que amplia a utilidade do agente.

As saídas do módulo de atuação retornam ao ambiente e fecham o circuito. Esses resultados são percebidos pelo agente novamente. Eles atualizam o estado interno do agente e informam as decisões futuras, completando assim o ciclo de perceber, raciocinar e agir.