Grounding 和 Retrieval Augmented Generation - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Grounding 和 Retrieval Augmented Generation

在企業生產環境中部署 AI 系統時,信任、準確性和可解釋性至關重要。基礎模型 FMs) 提供令人驚豔的一般功能。不過,他們受過大規模公有企業的訓練,通常缺乏對專屬資料、商業規則或最近變更的認知。

為了解決這些意識差距,請透過 Amazon Bedrock 知識庫 AWS 啟用擷取增強生成 (RAG)。RAG 是一種強大的架構模式,將 FM 回應放在外部的領域特定知識中,同時提供事實準確性和內容相關性。

RAG 透過結合兩個程序來增強大型語言模型 (LLM) 輸出:

  • 擷取 – 使用語意搜尋機制 (通常由向量內嵌提供支援),從精選的知識來源 (例如內部文件、產品手冊和案例日誌) 識別相關內容。

  • 產生 – 將擷取的內容作為提示的一部分提供給 LLM,使其能夠根據該授權資訊制定答案。

此方法可讓「關閉書籍」基礎模型像存取您的即時、精選企業資料一樣運作,無需重新訓練。

例如,員工向內部 AI 助理詢問「我們的旅遊政策是什麼?」 助理的答案是透過使用 Amazon Simple Storage Service (Amazon S3) 中託管的人力資源 (HR) 文件來建立,而不需要微調模型。

Amazon Bedrock 中的接地

Amazon Bedrock 透過其知識庫功能支援接地,可讓開發人員設定企業內容儲存庫並將其連結至基礎模型,而無需管理基礎設施。

在 Amazon Bedrock 中接地的關鍵功能包括下列項目:

  • 使用支援的 FM 供應商自動內嵌文件

  • 對存放在 Amazon S3 中的 PDFs、HTML、Word 文件或文字檔案進行語意搜尋

  • 無需微調即可接地,因為內容會插入 LLM 的內容視窗

  • Amazon Bedrock 代理程式搭配使用,以執行複雜的推理或多步驟工具使用

Amazon Bedrock 知識庫中支援的接地來源包括下列項目:

  • Amazon S3 (原生支援) 和 Confluence、SharePoint、 Salesforce或 Web 爬蟲程式 (預覽)

  • 使用向量存放區預先內嵌的索引,例如 Amazon Aurora、Amazon OpenSearch Serverless、Amazon Neptune Analytics、MongoDB、 Pinecone和 Redis Enterprise Cloud。

Amazon Bedrock 中接地的模型支援包括下列項目:

  • 所有與 Amazon Bedrock 相容的 LLMs 都支援接地。

  • Amazon Nova 模型已使用混合擷取技術,針對文字、影像和影片的基礎進行最佳化。

  • Amazon Bedrock 代理程式可以進一步協調接地輸出,以進行推理和決策。

與代理式 AI 整合

RAG 透過讓 Amazon Bedrock 代理程式能夠根據內容智慧和政策意識採取行動,特別適合與 Amazon Bedrock 代理程式搭配使用。以下是代理程式工作流程的範例:

  1. 使用者輸入會傳送至 Amazon EventBridge,並將其傳送至 Amazon Bedrock 代理程式。

  2. 客服人員叫用知識庫來搜尋內部文件。

  3. 擷取的內容會內嵌在 LLM 提示中。

  4. LLM 會產生具有參考和可追蹤性的基礎輸出。

  5. (選用) 代理程式會將輸出和支援證據存放在記憶體中,以供未來動作使用。

此工作流程可讓代理程式推理基礎內容,並做出可解釋的決策,彌補一般用途智慧和特定網域應用程式之間的差距。

新增安全與合規的護欄

接地可提高準確性,但生產級 AI 需要明確控制模型可以說或不能說的內容。Amazon Bedrock Guardrails 功能會限制代理程式行為並強制執行企業政策。

護欄的功能包括下列項目:

  • 內容篩選條件 – 防止違反安全或合規標準的輸出,包括遮罩個人身分識別資訊。

  • 拒絕主題 – 封鎖特定類別的回應 (例如,沒有醫療建議)。

  • 提示檢查 – 在推論之前識別和分割敏感輸入。

  • 使用者層級存取控制 – 使用 AWS Identity and Access Management (IAM) 根據身分和角色量身打造回應。

  • 工作階段內容限制 – 透過將代理程式擴展到特定任務來防止模型偏離。

透過護欄,組織可以安全地將推理和決策委派給客服人員,同時保留對語氣、行為和界限的控制。

除了 RAG 之外,自動推理

已接地的內容不足。代理程式必須推斷該內容。這是 LLM 型自動化推理變得至關重要的地方。自動化推理著重於讓客服人員在邏輯上進行推理,例如得出結論、做出決策或解決問題,而無需直接人工介入。

自動化推理會啟用下列項目:

  • 合成 – 比較、對比或摘要多個擷取的文件。

  • 多躍點邏輯 – 跨文件或區段連接事實以得出結論。

  • 決策 – 根據規則或偏好設定選擇衝突的資料。

  • 證據為基礎的回應 – 每個決策的輸出引文和理由。

這些功能會將基礎回應轉換為有理的答案,並將 Amazon Bedrock 代理程式從擷取工具轉換為網域感知建議程式。

透過提示鏈結、反射評估迴圈和多代理程式協同運作等工具,代理式 AI 系統可以模擬專家推理模式,例如診斷、分類、規劃或風險分析。

Amazon Nova 模型和基礎產生

使用 Amazon Nova Pro 和 Amazon Nova Premier,基礎 RAG 工作流程會延伸至多模式輸入,讓客服人員能夠解譯下列來源的 和 原因:

  • 註釋的文件和 PDF 檔案

  • 圖表、圖表和內嵌映像

  • 螢幕擷取畫面、表單和結構化資料視覺化

  • 影片文字記錄和投影片

此功能讓 Amazon Nova 特別適合需要深入了解豐富媒體內容的產業,例如法律案例、保險評估、臨床記錄或法規文件。

RAG 中的安全與控管

接地企業模型引入了新的責任,例如透過 RAG、知識庫或微調。您要將自己的資料和內容插入基礎模型。這除了模型選擇和提示 crafting 之外,還引入了新的責任。 AWS 建議以下控制項,這些控制項與護欄一起運作,以支援可信的企業部署:

  • 來源資料品質保證 - 基礎回應的可靠性僅與其根據的文件、資料庫或 APIs 相同。

  • 資料分類和可追蹤性 – 分類和標記內容來源,以顯示基礎回應的來源。

  • 存取控制 – 將私有文件注入提示會提高安全性和隱私權風險。限制透過 IAM 存取特定文件或內嵌。

  • 更新和偏離管理 – 基礎知識必須隨著您的業務發展。必須有版本控制、更新政策和自動重新索引,以防止模型輸出中的偏離或過時資訊。

  • 管理內嵌智慧 – 您現在使用 AI 部署組織知識。該功能具有驗證、監控和管理表達方式的責任,尤其是在醫療保健和金融等受管制網域中。

  • 提示可觀測性 – 基礎系統必須遵守 IP 權利、法規要求和公司免責聲明。擷取完整的提示、內容和回應鏈,以確保合規性。

  • 稽核記錄 – 透過 和結構化 CloudWatch 日誌追蹤擷取 AWS CloudTrail 和推論。

  • 使用者意見回饋和更正迴圈 – 企業負責讓使用者標記錯誤的基礎、不正確的答案或不相關的來源,並路由該意見回饋以改善未來相關性。

  • 記憶體控制 – 選擇是否保留工作階段的推斷洞見。

  • 字符預算最佳化 – 接地新增大量文字區塊時,會增加字符用量 (和成本)。您必須平衡 RAG 精確度和提示經濟,通常是透過區塊化、摘要或中繼資料篩選。

接地和 RAG 摘要

RAG 是安全且可擴展企業 AI 的基礎策略。透過以權威性內部知識為基礎的基礎模型,RAG 會將大型語言模型從一般用途產生器轉換為網域感知、政策一致且可解釋的 AI 助理。此方法可減少幻覺、強制執行內部政策的合規性,並啟用以事實為基礎的情境式回應,讓生成式 AI 同時適用於面向客戶和員工的應用程式。

結合自動推理和護欄時,基礎模型不僅會成為工具,還會成為負責且信任的客服人員。透過 Amazon Bedrock 無伺服器 RAG 支援和 Amazon Nova 多模式功能,組織可以在其業務中擴展安全、高效能的 AI,而無需管理基礎設施。