传统代理架构:感知、理性、行动 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

传统代理架构:感知、理性、行动

下图说明了上一节中讨论的构建块在感知、理性、行为周期下是如何运作的。

核心构建块如何应用于传统的代理架构。

感知模块

感知模块充当代理与外部世界的感官接口。它将原始的环境输入转换为结构化表示,为推理提供信息。这包括处理多模态数据,例如文本、音频或传感器信号。

  • 文本输入可能来自用户命令、文档或对话。

  • 音频输入包括语音指示或环境声音。

  • 传感器输入可捕获真实世界的信号,例如运动、视觉馈送或 GPS。

摄取原始输入后,感知过程会执行特征提取,然后进行物体或事件识别和语义解释,以创建对当前情况的有意义的模型。这些输出为下游决策提供了结构化的背景,并将代理的推理锚定在现实世界的观测中。

原因模块

原因模块是代理的认知核心。它评估背景,制定意图并确定适当的行动。该模块通过使用所学知识和推理来编排目标驱动的行为。

原因模块由紧密集成的子模块组成:

  • 记忆:以短期和长期格式保存对话状态、任务上下文和情节历史记录。

  • 知识库:提供对符号规则、本体或学习模型(例如嵌入、事实和策略)的访问权限。

  • 目标和计划:定义预期结果并制定实现这些结果的行动策略。可以动态更新目标,也可以根据反馈对计划进行自适应性修改。

  • 决策:通过权衡选项、评估权衡和选择下一步行动,充当中央仲裁引擎。该子模块考虑了置信度阈值、目标一致性和情境约束。

这些组件共同使代理能够推理其环境,更新信念,选择路径,并以连贯的适应性方式行事。原因模块缩小了感知和行为之间的差距。

Act 模块

act 模块通过与数字或物理环境接口来执行任务,从而执行代理的选定决策。这就是意图变成行动的地方。

该模块包括三个功能通道:

  • 执行器:对于有物理存在的代理(例如机器人和物联网设备),控制硬件级的交互,例如移动、操纵或信号。

  • 执行:处理基于软件的操作,包括调用 APIs、调度命令和更新系统。

  • 工具:启用诸如搜索、摘要、代码执行、计算和文档处理等功能功能。这些工具通常是动态的和上下文感知的,从而扩展了代理的实用性。

act 模块的输出反馈到环境中并关闭循环。代理会再次感知到这些结果。它们更新代理的内部状态并为未来的决策提供信息,从而完成感知、理性、行为周期。