基本推理代理 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

基本推理代理

基本推理代理是最简单的代理人工智能形式,它根据查询执行逻辑推理或决策。它接受用户或系统的输入,处理查询,并使用结构化提示生成响应。

这种模式对于需要根据给定上下文进行单步推理、分类或总结的任务很有用。它不使用内存、工具或状态管理,这使得它在大型工作流程中具有无状态、轻量级且高度可组合。

Architecture

基本推理代理的流程如下图所示:

基本推理剂。

描述

  1. 接收输入

    • 用户、系统或上游代理提交查询或指令。

    • 输入将移交给代理 shell 或编排层。

    • 此步骤包括任何预处理、提示模板和目标识别。

  2. 调用 LLM

    • 代理将查询转换为结构化提示并将其发送给 LLM(例如,通过 Amazon Bedrock)。

    • LLM 使用预先训练的知识和上下文根据提示生成响应。

    • 生成的输出可能包括推理步骤 (chain-of-thought)、最终答案或排名选项。

  3. 返回响应

    • 生成的输出将中继到代理的接口。

    • 这可能包括格式化、后处理或 API 响应。

功能

  • 支持自然语言或结构化输入

  • 使用提示工程来指导行为

  • 无状态且可扩展

  • 可以嵌入到 UI APIs、CLI 和管道中

限制

  • 没有记忆力或历史意识

  • 不与外部工具或数据源交互

  • 仅限于法学硕士在推理时所知道的情况

常见使用案例

  • 对话问题和答案

  • 政策解释和摘要

  • 决策指南

  • 轻量级且自动化的聊天机器人流程

  • 分类、标签和评分

实施指导

您可以使用以下工具和服务来创建基本的推理代理:

  • 用于调用 LLM 的 Amazon Bedrock(Anthropic、、Meta) AI21

  • Amazon API Gateway 或者 AWS Lambda 将其作为无状态微服务公开

  • 提示模板存储在参数存储库中 AWS Secrets Manager,或存储为代码

Summary

由于其结构简单,基本的推理代理是基础性的。它具有核心功能,可以将目标转化为推理路径,从而实现智能输出。这种模式通常是高级模式的起点,例如基于工具的代理和使用检索增强生成 (RAG) 的代理。它也是大型工作流程的可靠模块化组件。

RAG 探员

检索增强生成 (RAG) 是一种将信息检索与文本生成相结合的技术,可创建准确的上下文相关响应。RAG使代理能够在聘请法学硕士之前检索相关的外部信息。它通过将决策建立在事实或特定领域的信息基础上 up-to-date,从而扩展代理的有效记忆力和推理准确性。与仅依赖预训练权重 LLMs 的无状态相比,RAG 有一个外部知识搜索层,可以根据上下文动态增强提示。

Architecture

RAG 模式的逻辑如下图所示:

RAG 探员。

描述

  1. 收到查询

    • 用户或上游系统向代理提交查询或目标。

    • 代理 shell 接受请求并将其格式化为推理提示。

  2. 搜索外部来源

    • 代理从查询中识别概念和意图。

    • 它使用语义搜索或关键字匹配来查询知识源,例如矢量存储、数据库或文档索引。

    • 检索最相关的段落、文档或实体,以便在下一步中使用。

  3. 生成上下文响应

    • 代理使用检索到的信息对提示进行扩充,从而为 LLM 形成上下文增强输入。

    • 法学硕士使用生成推理(例如 chain-of-thought或反射)处理任何输入,以产生准确的响应。

  4. 返回最终输出

    • 代理通过将输出封装在任何通信标头或所需格式中来准备输出,然后将其返回给用户或呼叫系统。

    • (可选)检索到的文档和 LLM 输出可能会被记录、评分并存储在内存中以备将来查询。

功能

  • 即使在长尾或企业特定领域也能以事实为依据的输出

  • 无需微调模型即可扩展内存

  • 基于每个查询和用户状态的动态上下文

  • 与矢量数据库、语义索引和元数据筛选完全兼容

常见使用案例

  • 企业知识助手

  • 监管合规机器人

  • 客户支持副驾驶

  • 搜索增强型聊天机器人

  • 开发者文档代理

实施指导

使用以下工具和服务创建使用 RAG 的代理:

  • 用于调用 LLM 的 Amazon Bedrock

  • 用于文档或结构化数据搜索的 Amazon Kendra 或 Amazon Aurora OpenSearch

  • 用于存储文档的亚马逊简单存储服务 (Amazon S3) Service

  • AWS Lambda 编排搜索、提示和 LLM 推理

  • 与代理进行基于知识的集成(通过使用内存插件、语义检索器或 Amazon Bedrock)

Summary

Agent RAG 将静态模型推理与动态的现实世界智能联系起来。它使代理能够查找他们不知道的内容,从检索到的知识中综合答案,并生成高度可信、可审计的响应。

RAG 模式是构建无需再培训即可扩展知识访问权限的智能代理的基础。它通常是更复杂的编排模式的前身,涉及工具使用、计划和长期记忆。