Principais componentes dos agentes de software - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Principais componentes dos agentes de software

O diagrama a seguir apresenta os principais módulos funcionais encontrados na maioria dos agentes inteligentes. Cada componente contribui para a capacidade do agente de operar de forma autônoma em ambientes complexos.

Principais módulos e submódulos funcionais em agentes inteligentes.

No contexto do ciclo de perceber, raciocinar e agir, a capacidade de raciocínio de um agente é distribuída em seus módulos cognitivo e de aprendizagem. Por meio da integração da memória e do aprendizado, o agente desenvolve um raciocínio adaptativo baseado em experiências passadas. Conforme o agente age em seu ambiente, ele cria um ciclo de feedback emergente: cada ação influencia as percepções futuras, e a experiência resultante é incorporada à memória e aos modelos internos por meio do módulo de aprendizagem. Esse ciclo contínuo de percepção, raciocínio e ação permite que o agente melhore com o tempo e complete o ciclo completo de perceber, raciocinar e agir.

Módulo de percepção

O módulo de percepção permite que o agente interaja com seu ambiente por meio de diversas modalidades de entrada, como texto, áudio e sensores. Essas entradas formam os dados brutos nos quais todo raciocínio e ação se baseiam. As entradas de texto podem incluir solicitações em linguagem natural, comandos estruturados ou documentos. As entradas de áudio abrangem instruções faladas ou sons ambientais. As entradas do sensor incluem dados físicos, como feeds visuais, sinais de movimento ou coordenadas GPS. A função principal da percepção é extrair características e representações significativas desses dados brutos. Isso permite que o agente construa uma compreensão precisa e acionável de seu contexto atual. O processo pode envolver extração de características, reconhecimento de objetos ou eventos e interpretação semântica, e constitui a primeira etapa crítica no ciclo de perceber, raciocinar e agir. A percepção eficaz garante que o raciocínio e a tomada de decisões posteriores sejam baseados na consciência situacional relevante. up-to-date

Módulo cognitivo

O módulo cognitivo serve como o núcleo deliberativo do agente de software. É responsável por interpretar as percepções, formar a intenção e orientar o comportamento proposital por meio de planejamento e tomada de decisões orientados por metas. Esse módulo transforma as entradas em processos estruturados de raciocínio, o que permite que o agente opere intencionalmente em vez de reativamente. Esses processos são gerenciados por meio de três submódulos principais: metas, planejamento e tomada de decisão.

Submódulo de metas

O submódulo de metas define a intenção e a direção do agente. As metas podem ser explícitas (por exemplo, “navegar até um local” ou “enviar um relatório”) ou implícitas (por exemplo, “maximizar o engajamento do usuário” ou “minimizar a latência”). Eles são fundamentais para o ciclo de raciocínio do agente e fornecem um estado alvo para seu planejamento e suas decisões.

O agente avalia continuamente o progresso em direção a suas metas e pode repriorizar ou regenerar metas com base em novas percepções ou aprendizado. Essa consciência da meta mantém o agente adaptável em ambientes dinâmicos.

Submódulo de planejamento

O submódulo de planejamento constrói estratégias para atingir os objetivos atuais do agente. Ele gera sequências de ações, decompõe tarefas hierarquicamente e seleciona planos predefinidos ou gerados dinamicamente.

Para operar de forma eficaz em ambientes não determinísticos ou em mudança, o planejamento não é estático. Agentes modernos podem gerar chain-of-thought sequências, introduzir metas secundárias como etapas intermediárias e revisar planos em tempo real quando as condições mudam.

Esse submódulo se conecta estreitamente à memória e ao aprendizado e permite que o agente refine seu planejamento ao longo do tempo com base nos resultados anteriores.

Submódulo de tomada de decisão

O submódulo de tomada de decisão avalia os planos e ações disponíveis para selecionar a próxima etapa mais apropriada. Ele integra informações da percepção, do plano atual, das metas do agente e do contexto ambiental.

A tomada de decisão é responsável por:

  • Compensações entre metas conflitantes

  • Limites de confiança (por exemplo, incerteza na percepção)

  • Consequências das ações

  • A experiência aprendida do agente

Dependendo da arquitetura, os agentes podem confiar em raciocínio simbólico, heurística, aprendizado por reforço ou modelos de linguagem (LLMs) para tomar decisões informadas. Esse processo garante que o comportamento do agente seja sensível ao contexto, alinhado às metas e adaptável.

Módulo de ação

O módulo de ação é responsável por executar as decisões selecionadas pelo agente e interagir com o mundo externo ou sistemas internos para produzir efeitos significativos. Representa a fase de Ação do ciclo de perceber, raciocinar e agir, onde a intenção é transformada em comportamento.

Quando o módulo cognitivo seleciona uma ação, o módulo de ação coordena a execução por meio de submódulos especializados, onde cada submódulo se alinha ao ambiente integrado do agente:

  • Atuação física: para agentes incorporados em sistemas robóticos ou dispositivos de IoT, esse submódulo traduz decisões em movimentos físicos do mundo real ou instruções em nível de hardware.

    Exemplos: dirigir um robô, acionar uma válvula, ligar um sensor.

  • Interação integrada: este submódulo lida com ações não físicas, mas visíveis externamente, como interagir com sistemas de software, plataformas ou. APIs

    Exemplos: enviar um comando para um serviço de nuvem, atualizar um banco de dados, enviar um relatório chamando uma API.

  • Invocação de ferramentas: os agentes geralmente ampliam seus recursos usando ferramentas especializadas para realizar subtarefas, como as seguintes:

    • Pesquisa: consultar fontes de conhecimento estruturadas ou não estruturadas

    • Resumindo: comprimindo entradas de texto grandes em visões gerais de alto nível

    • Cálculo: realizando computação lógica, numérica ou simbólica

    A invocação de ferramentas permite uma composição complexa de comportamentos por meio de habilidades modulares que podem ser chamadas.

Módulo de aprendizagem

O módulo de aprendizado permite que os agentes se adaptem, generalizem e melhorem ao longo do tempo com base na experiência. Ele apóia o processo de raciocínio refinando continuamente os modelos, estratégias e políticas de decisão internos do agente usando o feedback da percepção e da ação.

Este módulo opera em coordenação com a memória de curto e longo prazo:

  • Memória de curto prazo: armazena contexto transitório, como estado do diálogo, informações da tarefa atual e observações recentes. Isso ajuda o agente a manter a continuidade nas interações e tarefas.

  • Memória de longo prazo: codifica o conhecimento persistente de experiências passadas, incluindo metas previamente encontradas, resultados de ações e estados ambientais. A memória de longo prazo permite que o agente reconheça padrões, reutilize estratégias e evite a repetição de erros.

Modos de aprendizagem

O módulo de aprendizado oferece suporte a uma variedade de paradigmas, como aprendizado supervisionado, não supervisionado e por reforço, que oferecem suporte a diferentes ambientes e funções de agentes:

  • Aprendizado supervisionado: atualiza modelos internos com base em exemplos rotulados, geralmente de feedback humano ou conjuntos de dados de treinamento.

    Exemplo: aprender a classificar a intenção do usuário com base em conversas anteriores.

  • Aprendizado não supervisionado: identifica padrões ou estruturas ocultas nos dados sem rótulos explícitos.

    Exemplo: agrupamento de sinais ambientais para detectar anomalias.

  • Aprendizado por reforço: otimiza o comportamento por meio de tentativa e erro, maximizando a recompensa cumulativa em ambientes interativos.

    Exemplo: aprender qual estratégia leva à conclusão mais rápida da tarefa.

O aprendizado se integra perfeitamente ao módulo cognitivo do agente. Ele refina as estratégias de planejamento com base em resultados passados, aprimora a tomada de decisões por meio da avaliação do sucesso histórico e melhora continuamente o mapeamento entre percepção e ação. Por meio desse ciclo fechado de aprendizado e feedback, os agentes evoluem além da execução reativa para se tornarem sistemas de autoaperfeiçoamento capazes de se adaptar a novas metas, condições e contextos ao longo do tempo.