本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
内存增强代理
通过使用短期和长期记忆进行存储、检索和推理的能力,增强了内存增强型代理。这使他们能够在多个任务、会话和互动中保持背景信息,从而产生更连贯、更个性化和更具战略性的响应。
与无状态代理不同,内存增强型代理通过引用历史数据进行调整,从先前的结果中学习,并做出符合用户目标、偏好和环境的决策。
Architecture
内存增强代理如下图所示:
描述
-
接收输入或事件
-
代理接收用户查询或系统事件。这可能是文本、API 触发器或环境变化。
-
-
检索短期记忆
-
代理检索与会话或工作流程相关的近期对话历史记录、任务上下文或系统状态。
-
-
检索长期记忆
-
代理查询长期内存(例如,矢量数据库和键值存储)以获取历史见解,例如:
-
用户偏好
-
过去的决定和结果
-
学到的概念、总结或经验
-
-
-
通过法学硕士学位考试的原因
-
记忆上下文嵌入到 LLM 提示符中,允许代理根据当前输入和先验知识进行推理。
-
-
生成输出
-
代理会根据任务历史记录和用户输入生成情境感知的响应、计划或操作,并对其进行个性化设置。
-
-
更新内存
-
存储了新的信息,例如更新的目标、成功和失败的信号以及结构化的响应,以备将来的任务之用。
-
功能
-
跨对话或事件的会话连续性
-
目标随着时间的推移而保持不变
-
基于不断变化的状态的情境感知
-
以往的成功和失败为依据的适应性
-
根据用户偏好和历史记录进行个性化设置
常见使用案例
-
记住用户偏好的对话副驾驶
-
跟踪代码库变化的编码代理
-
可根据任务历史进行调整的工作流代理
-
从系统知识演变而来的数字双胞胎
-
避免重复检索的研究代理
实现内存增强代理
AWS 服务 对于内存增强型代理,请使用以下工具:
内存层 |
AWS 服务 |
目的 |
|---|---|---|
短期 |
亚马逊 DynamoDB、Redis、亚马逊 Bedrock 上下文 |
快速检索最近的交互状态 |
长期(结构化) |
亚马逊 Aurora、亚马逊 DynamoDB、亚马逊 Neptune |
事实、关系和日志 |
长期(语义) |
OpenSearch、PostgreSQL、Pinecone |
基于嵌入的检索(即 RAG) |
存储 |
Amazon S3 |
存储笔录、结构化记忆和文件 |
编排 |
AWS Lambda 或者 AWS Step Functions |
管理内存注入和更新生命周期 |
Reasoning |
Amazon Bedrock |
带有记忆提示的 Anthropic Claude 或 Mi |
实现注入内存的提示
要将记忆整合到代理推理中,请结合使用结构化状态和检索增强上下文注入:
-
在为语言模型构建提示时,将最新的代理状态和最近的对话历史记录作为结构化输入,这样它就可以在完整的上下文中进行推理。
-
使用检索增强生成 (RAG) 从长期记忆中提取相关文档或事实。
-
总结之前的计划、背景和互动,以实现压缩和相关性。
-
在推理过程中注入外部存储器模块,例如向量存储或结构化日志,以指导决策。
Summary
增强内存的代理通过从经验中学习和记住用户情境来保持思维的连续性。这些代理通过使用长期协作、个性化和战略推理,超越了被动情报。就代理人工智能而言,内存使代理的行为更像自适应数字对应物,而不像无状态工具。