本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Grounding 和 Retrieval Augmented Generation
<a name="grounding-and-rag"></a>

在企業生產環境中部署 AI 系統時，信任、準確性和可解釋性至關重要。基礎模型 FMs) 提供令人驚豔的一般功能。不過，他們受過大規模公有企業的訓練，通常缺乏對專屬資料、商業規則或最近變更的認知。

為了解決這些意識差距，請透過 Amazon Bedrock 知識庫 AWS 啟用*擷取增強生成 (RAG)*。RAG 是一種強大的架構模式，將 FM 回應放在外部的領域特定知識中，同時提供事實準確性和內容相關性。

RAG 透過結合兩個程序來增強大型語言模型 (LLM) 輸出：
+ **擷取** – 使用語意搜尋機制 （通常由向量內嵌提供支援），從精選的知識來源 （例如內部文件、產品手冊和案例日誌） 識別相關內容。
+ **產生** – 將擷取的內容作為提示的一部分提供給 LLM，使其能夠根據該授權資訊制定答案。

此方法可讓「關閉書籍」基礎模型像存取您的即時、精選企業資料一樣運作，無需重新訓練。

例如，員工向內部 AI 助理詢問「我們的旅遊政策是什麼？」 助理的答案是透過使用 Amazon Simple Storage Service (Amazon S3) 中託管的人力資源 (HR) 文件來建立，而不需要微調模型。

## Amazon Bedrock 中的接地
<a name="section-rag-bedrock-grounding"></a>

Amazon Bedrock 透過其[知識庫](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html)功能支援接地，可讓開發人員設定企業內容儲存庫並將其連結至基礎模型，而無需管理基礎設施。

在 Amazon Bedrock 中接地的關鍵功能包括下列項目：
+ 使用支援的 FM 供應商**自動內嵌**文件
+ 對存放在 Amazon S3 中的 PDFs、HTML、Word 文件或文字檔案進行**語意搜尋** 
+ **無需微調即可接地**，因為內容會插入 LLM 的內容視窗
+ **與 ****Amazon Bedrock**** 代理程式**搭配使用，以執行複雜的推理或多步驟工具使用

Amazon Bedrock 知識庫中支援的接地來源包括下列項目：
+ Amazon S3 （原生支援） 和 Confluence、SharePoint、 Salesforce或 Web 爬蟲程式 （預覽）
+ 使用向量存放區預先內嵌的索引，例如 Amazon Aurora、Amazon OpenSearch Serverless、Amazon Neptune Analytics、MongoDB、 Pinecone和 Redis Enterprise Cloud。

Amazon Bedrock 中接地的模型支援包括下列項目：
+ 所有與 Amazon Bedrock 相容的 LLMs 都支援接地。
+ Amazon Nova 模型已使用混合擷取技術，針對文字、影像和影片的基礎進行最佳化。
+ Amazon Bedrock 代理程式可以進一步協調接地輸出，以進行推理和決策。

## 與代理式 AI 整合
<a name="section-rag-agentic-integration"></a>

RAG 透過讓 Amazon Bedrock 代理程式能夠根據內容智慧和政策意識採取行動，特別適合與 Amazon Bedrock 代理程式搭配使用。以下是代理程式工作流程的範例：

1. 使用者輸入會傳送至 Amazon EventBridge，並將其傳送至 Amazon Bedrock 代理程式。

1. 客服人員叫用知識庫來搜尋內部文件。

1. 擷取的內容會內嵌在 LLM 提示中。

1. LLM 會產生具有參考和可追蹤性的基礎輸出。

1. （選用） 代理程式會將輸出和支援證據存放在記憶體中，以供未來動作使用。

此工作流程可讓代理程式推理基礎內容，並做出可解釋的決策，彌補一般用途智慧和特定網域應用程式之間的差距。

## 新增安全與合規的護欄
<a name="section-rag-guardrails"></a>

接地可提高準確性，但生產級 AI 需要明確控制模型可以說或不能說的內容。[Amazon Bedrock Guardrails](https://docs.aws.amazon.com/bedrock/latest/userguide/guardrails.html) 功能會限制代理程式行為並強制執行企業政策。

護欄的功能包括下列項目：
+ **內容篩選條件** – 防止違反安全或合規標準的輸出，包括遮罩個人身分識別資訊。
+ **拒絕主題** – 封鎖特定類別的回應 （例如，沒有醫療建議）。
+ **提示檢查** – 在推論之前識別和分割敏感輸入。
+ **使用者層級存取控制** – 使用 AWS Identity and Access Management (IAM) 根據身分和角色量身打造回應。
+ **工作階段內容限制** – 透過將代理程式擴展到特定任務來防止模型偏離。

透過護欄，組織可以安全地將推理和決策委派給客服人員，同時保留對語氣、行為和界限的控制。

## 除了 RAG 之外，自動推理
<a name="section-rag-automated-reasoning"></a>

已接地的內容不足。代理程式必須推斷該內容。這是 LLM 型自動化推理變得至關重要的地方。自動化推理著重於讓客服人員在邏輯上進行推理，例如得出結論、做出決策或解決問題，而無需直接人工介入。

自動化推理會啟用下列項目：
+ **合成** – 比較、對比或摘要多個擷取的文件。
+ **多躍點邏輯 – **跨文件或區段連接事實以得出結論。
+ **決策** – 根據規則或偏好設定選擇衝突的資料。
+ 以**證據為基礎的回應** – 每個決策的輸出引文和理由。

這些功能會將基礎回應轉換為有理的答案，並將 Amazon Bedrock 代理程式從擷取工具轉換為網域感知建議程式。

透過提示鏈結、反射評估迴圈和多代理程式協同運作等工具，代理式 AI 系統可以模擬專家推理模式，例如診斷、分類、規劃或風險分析。

## Amazon Nova 模型和基礎產生
<a name="section-rag-nova-models"></a>

使用 Amazon Nova Pro 和 Amazon Nova Premier，基礎 RAG 工作流程會延伸至多模式輸入，讓客服人員能夠解譯下列來源的 和 原因：
+ 註釋的文件和 PDF 檔案
+ 圖表、圖表和內嵌映像
+ 螢幕擷取畫面、表單和結構化資料視覺化 
+ 影片文字記錄和投影片

此功能讓 Amazon Nova 特別適合需要深入了解豐富媒體內容的產業，例如法律案例、保險評估、臨床記錄或法規文件。

## RAG 中的安全與控管
<a name="section-rag-security-governance"></a>

接地企業模型引入了新的責任，例如透過 RAG、知識庫或微調。您要將自己的資料和內容插入基礎模型。這除了模型選擇和提示 crafting 之外，還引入了新的責任。 AWS 建議以下控制項，這些控制項與護欄一起運作，以支援可信的企業部署：
+ **來源資料品質保證** - 基礎回應的可靠性僅與其根據的文件、資料庫或 APIs 相同。
+ **資料分類和可追蹤性** – 分類和標記內容來源，以顯示基礎回應的來源。
+ **存取控制** – 將私有文件注入提示會提高安全性和隱私權風險。限制透過 IAM 存取特定文件或內嵌。
+ **更新和偏離管理** – 基礎知識必須隨著您的業務發展。必須有版本控制、更新政策和自動重新索引，以防止模型輸出中的偏離或過時資訊。
+ **管理內嵌智慧** – 您現在使用 AI 部署組織知識。該功能具有驗證、監控和管理表達方式的責任，尤其是在醫療保健和金融等受管制網域中。
+ **提示可觀測性** – 基礎系統必須遵守 IP 權利、法規要求和公司免責聲明。擷取完整的提示、內容和回應鏈，以確保合規性。
+ **稽核記錄** – 透過 和結構化 CloudWatch 日誌追蹤擷取 AWS CloudTrail 和推論。
+ **使用者意見回饋和更正迴圈** – 企業負責讓使用者標記錯誤的基礎、不正確的答案或不相關的來源，並路由該意見回饋以改善未來相關性。
+ **記憶體控制** – 選擇是否保留工作階段的推斷洞見。
+ **字符預算最佳化** – 接地新增大量文字區塊時，會增加字符用量 （和成本）。您必須平衡 RAG 精確度和提示經濟，通常是透過區塊化、摘要或中繼資料篩選。

## 接地和 RAG 摘要
<a name="section-rag-summary"></a>

RAG 是安全且可擴展企業 AI 的基礎策略。透過以權威性內部知識為基礎的基礎模型，RAG 會將大型語言模型從一般用途產生器轉換為網域感知、政策一致且可解釋的 AI 助理。此方法可減少幻覺、強制執行內部政策的合規性，並啟用以事實為基礎的情境式回應，讓生成式 AI 同時適用於面向客戶和員工的應用程式。

結合自動推理和護欄時，基礎模型不僅會成為工具，還會成為負責且信任的客服人員。透過 Amazon Bedrock 無伺服器 RAG 支援和 Amazon Nova 多模式功能，組織可以在其業務中擴展安全、高效能的 AI，而無需管理基礎設施。