記憶體增強型代理程式

透過使用短期和長期記憶體來儲存、擷取和說明原因，增強了記憶體增強型代理程式的功能。這可讓他們維持跨多個任務、工作階段和互動的內容，進而產生更一致、個人化的策略回應。

與無狀態代理程式不同，記憶體增強型代理程式會透過參考歷史資料、從先前的結果中學習，以及做出符合使用者目標、偏好設定和環境的決策來進行調整。

Architecture

下圖顯示記憶體增強型代理程式：

接收輸入或事件
- 客服人員會收到使用者查詢或系統事件。這可能是文字、API 觸發條件或環境變更。
擷取短期記憶體
- 客服人員會擷取最近的對話歷史記錄、任務內容，或與工作階段或工作流程相關的系統狀態。
擷取長期記憶體
- 代理程式會查詢長期記憶體（例如向量資料庫和鍵值存放區）以取得歷史洞見，例如：
  - 使用者偏好設定
  - 過去的決策和結果
  - 學到的概念、摘要或體驗
透過 LLM 的原因
- 記憶體內容會嵌入 LLM 提示中，允許代理程式根據目前輸入和先前的知識進行推理。
產生輸出
- 代理程式會產生上下文感知的回應、計劃或動作，並根據任務歷史記錄和使用者的輸入進行個人化。
更新記憶體
- 更新的目標、成功和失敗訊號，以及結構化回應等新資訊都會存放以供未來任務使用。

將下列工具和 AWS 服務用於記憶體增強型代理程式：

記憶體層	AWS 服務	用途
短期	Amazon DynamoDB、Redis、Amazon Bedrock 內容	快速擷取最近的互動狀態
長期（結構化）	Amazon Aurora、Amazon DynamoDB、Amazon Neptune	事實、關係和日誌
長期（語意）	OpenSearch、PostgreSQL、Pinecone	內嵌型擷取（即 RAG)
儲存	Amazon S3	儲存文字記錄、結構化記憶體和檔案
協調	AWS Lambda 或 AWS Step Functions	管理記憶體注入和更新生命週期
推理	Amazon Bedrock	具有記憶體提示的 Anthropic Claude 或 Mistral

若要將記憶體整合到代理程式推理中，請使用結構化狀態和擷取擴增內容注入的組合：

記憶體增強型代理程式透過從經驗中學習並記住使用者內容來維持思維持續性。這些客服人員使用長期協作、個人化和策略推理，超越被動式智慧。在代理式 AI 方面，記憶體可讓代理程式的行為更像是適應性數位對等，更不像無狀態工具。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

工作流程協同運作代理程式

模擬和測試平台代理程式