本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
基本推理代理程式
基本推理代理程式是最簡單的代理式 AI 形式,可執行邏輯推論或決策以回應查詢。它接受來自使用者或系統的輸入,並使用結構化提示處理查詢和產生回應。
此模式適用於需要根據指定內容進行單一步驟推理、分類或摘要的任務。它不使用記憶體、工具或狀態管理,這使得它在大型工作流程中無狀態、輕量且高度組合。
Architecture
下圖顯示基本推理代理程式的流程:
說明
-
接收輸入
-
使用者、系統或上游代理程式提交查詢或指示。
-
輸入會移交給代理程式 shell 或協同運作層。
-
此步驟包含任何預先處理、提示範本和目標識別。
-
-
叫用 LLM
-
代理程式會將查詢轉換為結構化提示,並將其傳送至 LLM (例如,透過 Amazon Bedrock)。
-
LLM 會根據使用預先訓練知識和內容的提示產生回應。
-
產生的輸出可能包括推理步驟 chain-of-thought)、最終答案或排名選項。
-
-
傳回回應
-
產生的輸出會轉送至客服人員的界面。
-
這可能包括格式化、後製處理或 API 回應。
-
功能
-
支援自然語言或結構化輸入
-
使用提示詞工程來引導行為
-
無狀態且可擴展
-
可以嵌入 UI、CLI、APIs 和管道
限制
-
沒有記憶體或歷史意識
-
與外部工具或資料來源沒有互動
-
僅限於 LLM 在推論時知道的內容
常用案例
-
對話式問題和答案
-
政策說明和摘要
-
制定決策的指引
-
輕量且自動化的聊天機器人流程
-
分類、標記和評分
實作指引
您可以使用下列工具和服務來建立基本推理代理程式:
-
Amazon Bedrock for LLM 調用 (Anthropic、AI21、Meta)
-
Amazon API Gateway 或 AWS Lambda 將其公開為無狀態微服務
-
儲存在參數存放區 AWS Secrets Manager或做為程式碼的提示範本
Summary
基本推理代理程式的基礎在於其簡單結構。它具有核心功能,可將目標轉換為導致智慧輸出的推理路徑。此模式通常是進階模式的起點,例如使用擷取擴增產生 (RAG) 的工具型代理程式和代理程式。它也是大型工作流程中可靠且模組化的元件。
代理程式 RAG
Retrieval-augmented Generation (RAG) 是一種將資訊擷取與文字產生結合的技術,以建立準確且情境式的回應。RAG 可讓客服人員先擷取相關的外部資訊,再與 LLM 互動。它將代理程式的決策以up-to-date、事實或特定網域資訊為基礎,藉此擴展代理程式的有效記憶體和推理準確性。與僅依賴預先訓練權重的無LLMs 相反,RAG 具有外部知識搜尋層,可動態增強具有內容的提示。
Architecture
RAG 模式的邏輯如下圖所示:
說明
-
接收查詢
-
使用者或上游系統向客服人員提交查詢或目標。
-
代理程式 shell 接受請求並將其格式化為推理提示。
-
-
搜尋外部來源
-
代理程式會從查詢中識別概念和意圖。
-
它會使用語意搜尋或關鍵字比對來查詢知識來源,例如向量存放區、資料庫或文件索引。
-
擷取最相關的段落、文件或實體,以供下一個步驟使用。
-
-
產生內容式回應
-
代理程式使用擷取的資訊增強提示,形成 LLM 的內容增強輸入。
-
LLM 使用生成推理 (例如chain-of-thought或反射鏈) 處理任何輸入,以產生準確的回應。
-
-
傳回最終輸出
-
代理程式會將其包裝在任何通訊標頭或必要的格式中,然後傳回給使用者或呼叫系統,以準備輸出。
-
(選用) 擷取的文件和 LLM 輸出可能會記錄、計分並存放在記憶體中,以供未來查詢使用。
-
功能
-
即使在長尾或企業特定網域中也是事實基礎的輸出
-
記憶體擴充功能,無需微調模型
-
根據每個查詢和使用者狀態的動態內容
-
與向量資料庫、語意索引和中繼資料篩選完全相容
常用案例
-
企業知識助理
-
法規合規機器人
-
客戶支援 Copilot
-
搜尋增強型聊天機器人
-
開發人員文件代理程式
實作指引
使用下列工具和服務來建立使用 RAG 的代理程式:
-
Amazon Bedrock for LLM 調用
-
適用於文件或結構化資料搜尋的 Amazon Kendra、OpenSearch 或 Amazon Aurora
-
文件儲存的 Amazon Simple Storage Service (Amazon S3)
-
AWS Lambda 協調搜尋、提示和 LLM 推論
-
知識型整合與代理程式 (使用記憶體外掛程式、語意擷取器或 Amazon Bedrock)
Summary
代理程式 RAG 將靜態模型推理連接到動態、真實世界的智慧。它讓客服人員能夠查詢他們不知道的內容、從擷取的知識合成答案,並產生高可稽核的可靠回應。
RAG 模式是建置智慧型代理程式的基礎,無需重新訓練即可擴展知識存取。它通常是涉及工具使用、規劃和長期記憶體的更複雜協同運作模式的前綴。