As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Arquitetura tradicional de agentes: perceber, raciocinar, agir
O diagrama a seguir ilustra como os blocos de construção discutidos na seção anterior operam sob o ciclo de perceber, raciocinar e agir.
Módulo Perceber
O módulo de percepção atua como a interface sensorial do agente com o mundo externo. Ele transforma a entrada ambiental bruta em representações estruturadas que informam o raciocínio. Isso inclui lidar com dados multimodais, como texto, áudio ou sinais de sensores.
-
A entrada de texto pode vir de comandos, documentos ou diálogos do usuário.
-
A entrada de áudio inclui instruções faladas ou sons ambientais.
-
A entrada do sensor captura sinais do mundo real, como movimento, feeds visuais ou GPS.
Quando a entrada bruta é ingerida, o processo de percepção realiza a extração de características, seguida pelo reconhecimento de objetos ou eventos e interpretação semântica para criar um modelo significativo da situação atual. Esses resultados fornecem contexto estruturado para a tomada de decisões posteriores e ancoram o raciocínio do agente em observações do mundo real.
Módulo Reason
O módulo reason é o núcleo cognitivo do agente. Ele avalia o contexto, formula a intenção e determina as ações apropriadas. Este módulo orquestra o comportamento orientado por metas usando tanto o conhecimento aprendido quanto o raciocínio.
O módulo Reason consiste em submódulos totalmente integrados:
-
Memória: mantém o estado do diálogo, o contexto da tarefa e o histórico episódico nos formatos de curto e longo prazo.
-
Base de conhecimento: fornece acesso a regras simbólicas, ontologias ou modelos aprendidos (como incorporações, fatos e políticas).
-
Metas e planos: define os resultados desejados e constrói estratégias de ação para alcançá-los. As metas podem ser atualizadas dinamicamente e os planos podem ser modificados de forma adaptativa com base no feedback.
-
Tomada de decisão: atua como o mecanismo central de arbitragem, ponderando as opções, avaliando as compensações e selecionando a próxima ação. Esse submódulo leva em consideração os limites de confiança, o alinhamento de metas e as restrições contextuais.
Juntos, esses componentes permitem que o agente raciocine sobre seu ambiente, atualize crenças, selecione caminhos e se comporte de maneira coerente e adaptativa. O módulo de razão fecha a lacuna entre percepção e comportamento.
Módulo Act
O módulo act executa a decisão selecionada pelo agente por meio da interface com o ambiente digital ou físico para realizar tarefas. É aqui que a intenção se torna ação.
Este módulo inclui três canais funcionais:
-
Atuadores: para agentes que têm presença física (como robôs e dispositivos de IoT), controlam as interações em nível de hardware, como movimento, manipulação ou sinalização.
-
Execução: manipula ações baseadas em software, incluindo invocação APIs, envio de comandos e atualização de sistemas.
-
Ferramentas: permite recursos funcionais, como pesquisa, resumo, execução de código, cálculo e manuseio de documentos. Essas ferramentas geralmente são dinâmicas e sensíveis ao contexto, o que amplia a utilidade do agente.
As saídas do módulo de atuação retornam ao ambiente e fecham o circuito. Esses resultados são percebidos pelo agente novamente. Eles atualizam o estado interno do agente e informam as decisões futuras, completando assim o ciclo de perceber, raciocinar e agir.