本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Grounding 和 Retrieval Augmented Generation
在企業生產環境中部署 AI 系統時,信任、準確性和可解釋性至關重要。基礎模型 FMs) 提供令人驚豔的一般功能。不過,他們受過大規模公有企業的訓練,通常缺乏對專屬資料、商業規則或最近變更的認知。
為了解決這些意識差距,請透過 Amazon Bedrock 知識庫 AWS 啟用擷取增強生成 (RAG)。RAG 是一種強大的架構模式,將 FM 回應放在外部的領域特定知識中,同時提供事實準確性和內容相關性。
RAG 透過結合兩個程序來增強大型語言模型 (LLM) 輸出:
-
擷取 – 使用語意搜尋機制 (通常由向量內嵌提供支援),從精選的知識來源 (例如內部文件、產品手冊和案例日誌) 識別相關內容。
-
產生 – 將擷取的內容作為提示的一部分提供給 LLM,使其能夠根據該授權資訊制定答案。
此方法可讓「關閉書籍」基礎模型像存取您的即時、精選企業資料一樣運作,無需重新訓練。
例如,員工向內部 AI 助理詢問「我們的旅遊政策是什麼?」 助理的答案是透過使用 Amazon Simple Storage Service (Amazon S3) 中託管的人力資源 (HR) 文件來建立,而不需要微調模型。
Amazon Bedrock 中的接地
Amazon Bedrock 透過其知識庫功能支援接地,可讓開發人員設定企業內容儲存庫並將其連結至基礎模型,而無需管理基礎設施。
在 Amazon Bedrock 中接地的關鍵功能包括下列項目:
-
使用支援的 FM 供應商自動內嵌文件
-
對存放在 Amazon S3 中的 PDFs、HTML、Word 文件或文字檔案進行語意搜尋
-
無需微調即可接地,因為內容會插入 LLM 的內容視窗
-
與 Amazon Bedrock 代理程式搭配使用,以執行複雜的推理或多步驟工具使用
Amazon Bedrock 知識庫中支援的接地來源包括下列項目:
-
Amazon S3 (原生支援) 和 Confluence、SharePoint、 Salesforce或 Web 爬蟲程式 (預覽)
-
使用向量存放區預先內嵌的索引,例如 Amazon Aurora、Amazon OpenSearch Serverless、Amazon Neptune Analytics、MongoDB、 Pinecone和 Redis Enterprise Cloud。
Amazon Bedrock 中接地的模型支援包括下列項目:
-
所有與 Amazon Bedrock 相容的 LLMs 都支援接地。
-
Amazon Nova 模型已使用混合擷取技術,針對文字、影像和影片的基礎進行最佳化。
-
Amazon Bedrock 代理程式可以進一步協調接地輸出,以進行推理和決策。
與代理式 AI 整合
RAG 透過讓 Amazon Bedrock 代理程式能夠根據內容智慧和政策意識採取行動,特別適合與 Amazon Bedrock 代理程式搭配使用。以下是代理程式工作流程的範例:
-
使用者輸入會傳送至 Amazon EventBridge,並將其傳送至 Amazon Bedrock 代理程式。
-
客服人員叫用知識庫來搜尋內部文件。
-
擷取的內容會內嵌在 LLM 提示中。
-
LLM 會產生具有參考和可追蹤性的基礎輸出。
-
(選用) 代理程式會將輸出和支援證據存放在記憶體中,以供未來動作使用。
此工作流程可讓代理程式推理基礎內容,並做出可解釋的決策,彌補一般用途智慧和特定網域應用程式之間的差距。
新增安全與合規的護欄
接地可提高準確性,但生產級 AI 需要明確控制模型可以說或不能說的內容。Amazon Bedrock Guardrails 功能會限制代理程式行為並強制執行企業政策。
護欄的功能包括下列項目:
-
內容篩選條件 – 防止違反安全或合規標準的輸出,包括遮罩個人身分識別資訊。
-
拒絕主題 – 封鎖特定類別的回應 (例如,沒有醫療建議)。
-
提示檢查 – 在推論之前識別和分割敏感輸入。
-
使用者層級存取控制 – 使用 AWS Identity and Access Management (IAM) 根據身分和角色量身打造回應。
-
工作階段內容限制 – 透過將代理程式擴展到特定任務來防止模型偏離。
透過護欄,組織可以安全地將推理和決策委派給客服人員,同時保留對語氣、行為和界限的控制。
除了 RAG 之外,自動推理
已接地的內容不足。代理程式必須推斷該內容。這是 LLM 型自動化推理變得至關重要的地方。自動化推理著重於讓客服人員在邏輯上進行推理,例如得出結論、做出決策或解決問題,而無需直接人工介入。
自動化推理會啟用下列項目:
-
合成 – 比較、對比或摘要多個擷取的文件。
-
多躍點邏輯 – 跨文件或區段連接事實以得出結論。
-
決策 – 根據規則或偏好設定選擇衝突的資料。
-
以證據為基礎的回應 – 每個決策的輸出引文和理由。
這些功能會將基礎回應轉換為有理的答案,並將 Amazon Bedrock 代理程式從擷取工具轉換為網域感知建議程式。
透過提示鏈結、反射評估迴圈和多代理程式協同運作等工具,代理式 AI 系統可以模擬專家推理模式,例如診斷、分類、規劃或風險分析。
Amazon Nova 模型和基礎產生
使用 Amazon Nova Pro 和 Amazon Nova Premier,基礎 RAG 工作流程會延伸至多模式輸入,讓客服人員能夠解譯下列來源的 和 原因:
-
註釋的文件和 PDF 檔案
-
圖表、圖表和內嵌映像
-
螢幕擷取畫面、表單和結構化資料視覺化
-
影片文字記錄和投影片
此功能讓 Amazon Nova 特別適合需要深入了解豐富媒體內容的產業,例如法律案例、保險評估、臨床記錄或法規文件。
RAG 中的安全與控管
接地企業模型引入了新的責任,例如透過 RAG、知識庫或微調。您要將自己的資料和內容插入基礎模型。這除了模型選擇和提示 crafting 之外,還引入了新的責任。 AWS 建議以下控制項,這些控制項與護欄一起運作,以支援可信的企業部署:
-
來源資料品質保證 - 基礎回應的可靠性僅與其根據的文件、資料庫或 APIs 相同。
-
資料分類和可追蹤性 – 分類和標記內容來源,以顯示基礎回應的來源。
-
存取控制 – 將私有文件注入提示會提高安全性和隱私權風險。限制透過 IAM 存取特定文件或內嵌。
-
更新和偏離管理 – 基礎知識必須隨著您的業務發展。必須有版本控制、更新政策和自動重新索引,以防止模型輸出中的偏離或過時資訊。
-
管理內嵌智慧 – 您現在使用 AI 部署組織知識。該功能具有驗證、監控和管理表達方式的責任,尤其是在醫療保健和金融等受管制網域中。
-
提示可觀測性 – 基礎系統必須遵守 IP 權利、法規要求和公司免責聲明。擷取完整的提示、內容和回應鏈,以確保合規性。
-
稽核記錄 – 透過 和結構化 CloudWatch 日誌追蹤擷取 AWS CloudTrail 和推論。
-
使用者意見回饋和更正迴圈 – 企業負責讓使用者標記錯誤的基礎、不正確的答案或不相關的來源,並路由該意見回饋以改善未來相關性。
-
記憶體控制 – 選擇是否保留工作階段的推斷洞見。
-
字符預算最佳化 – 接地新增大量文字區塊時,會增加字符用量 (和成本)。您必須平衡 RAG 精確度和提示經濟,通常是透過區塊化、摘要或中繼資料篩選。
接地和 RAG 摘要
RAG 是安全且可擴展企業 AI 的基礎策略。透過以權威性內部知識為基礎的基礎模型,RAG 會將大型語言模型從一般用途產生器轉換為網域感知、政策一致且可解釋的 AI 助理。此方法可減少幻覺、強制執行內部政策的合規性,並啟用以事實為基礎的情境式回應,讓生成式 AI 同時適用於面向客戶和員工的應用程式。
結合自動推理和護欄時,基礎模型不僅會成為工具,還會成為負責且信任的客服人員。透過 Amazon Bedrock 無伺服器 RAG 支援和 Amazon Nova 多模式功能,組織可以在其業務中擴展安全、高效能的 AI,而無需管理基礎設施。