Amazon Bedrock 中的接地與代理式 AI 整合新增安全與合規的護欄除了 RAG 之外，自動推理 Amazon Nova 模型和基礎產生 RAG 中的安全與控管接地和 RAG 摘要

Grounding 和 Retrieval Augmented Generation

在企業生產環境中部署 AI 系統時，信任、準確性和可解釋性至關重要。基礎模型 FMs) 提供令人驚豔的一般功能。不過，他們受過大規模公有企業的訓練，通常缺乏對專屬資料、商業規則或最近變更的認知。

為了解決這些意識差距，請透過 Amazon Bedrock 知識庫 AWS 啟用擷取增強生成 (RAG)。RAG 是一種強大的架構模式，將 FM 回應放在外部的領域特定知識中，同時提供事實準確性和內容相關性。

RAG 透過結合兩個程序來增強大型語言模型 (LLM) 輸出：

擷取 – 使用語意搜尋機制（通常由向量內嵌提供支援），從精選的知識來源（例如內部文件、產品手冊和案例日誌）識別相關內容。
產生 – 將擷取的內容作為提示的一部分提供給 LLM，使其能夠根據該授權資訊制定答案。

此方法可讓「關閉書籍」基礎模型像存取您的即時、精選企業資料一樣運作，無需重新訓練。

例如，員工向內部 AI 助理詢問「我們的旅遊政策是什麼？」助理的答案是透過使用 Amazon Simple Storage Service (Amazon S3) 中託管的人力資源 (HR) 文件來建立，而不需要微調模型。

Amazon Bedrock 中的接地

Amazon Bedrock 透過其知識庫功能支援接地，可讓開發人員設定企業內容儲存庫並將其連結至基礎模型，而無需管理基礎設施。

在 Amazon Bedrock 中接地的關鍵功能包括下列項目：

使用支援的 FM 供應商自動內嵌文件
對存放在 Amazon S3 中的 PDFs、HTML、Word 文件或文字檔案進行語意搜尋
無需微調即可接地，因為內容會插入 LLM 的內容視窗
與 Amazon Bedrock 代理程式搭配使用，以執行複雜的推理或多步驟工具使用

Amazon Bedrock 知識庫中支援的接地來源包括下列項目：

Amazon S3 （原生支援）和 Confluence、SharePoint、 Salesforce或 Web 爬蟲程式（預覽）
使用向量存放區預先內嵌的索引，例如 Amazon Aurora、Amazon OpenSearch Serverless、Amazon Neptune Analytics、MongoDB、 Pinecone和 Redis Enterprise Cloud。

Amazon Bedrock 中接地的模型支援包括下列項目：

所有與 Amazon Bedrock 相容的 LLMs 都支援接地。
Amazon Nova 模型已使用混合擷取技術，針對文字、影像和影片的基礎進行最佳化。
Amazon Bedrock 代理程式可以進一步協調接地輸出，以進行推理和決策。

與代理式 AI 整合

RAG 透過讓 Amazon Bedrock 代理程式能夠根據內容智慧和政策意識採取行動，特別適合與 Amazon Bedrock 代理程式搭配使用。以下是代理程式工作流程的範例：

使用者輸入會傳送至 Amazon EventBridge，並將其傳送至 Amazon Bedrock 代理程式。
客服人員叫用知識庫來搜尋內部文件。
擷取的內容會內嵌在 LLM 提示中。
LLM 會產生具有參考和可追蹤性的基礎輸出。
（選用）代理程式會將輸出和支援證據存放在記憶體中，以供未來動作使用。

此工作流程可讓代理程式推理基礎內容，並做出可解釋的決策，彌補一般用途智慧和特定網域應用程式之間的差距。

新增安全與合規的護欄

接地可提高準確性，但生產級 AI 需要明確控制模型可以說或不能說的內容。Amazon Bedrock Guardrails 功能會限制代理程式行為並強制執行企業政策。

護欄的功能包括下列項目：

內容篩選條件 – 防止違反安全或合規標準的輸出，包括遮罩個人身分識別資訊。
拒絕主題 – 封鎖特定類別的回應（例如，沒有醫療建議）。
提示檢查 – 在推論之前識別和分割敏感輸入。
使用者層級存取控制 – 使用 AWS Identity and Access Management (IAM) 根據身分和角色量身打造回應。
工作階段內容限制 – 透過將代理程式擴展到特定任務來防止模型偏離。

透過護欄，組織可以安全地將推理和決策委派給客服人員，同時保留對語氣、行為和界限的控制。

除了 RAG 之外，自動推理

已接地的內容不足。代理程式必須推斷該內容。這是 LLM 型自動化推理變得至關重要的地方。自動化推理著重於讓客服人員在邏輯上進行推理，例如得出結論、做出決策或解決問題，而無需直接人工介入。

自動化推理會啟用下列項目：

合成 – 比較、對比或摘要多個擷取的文件。
多躍點邏輯 – 跨文件或區段連接事實以得出結論。
決策 – 根據規則或偏好設定選擇衝突的資料。
以證據為基礎的回應 – 每個決策的輸出引文和理由。

這些功能會將基礎回應轉換為有理的答案，並將 Amazon Bedrock 代理程式從擷取工具轉換為網域感知建議程式。

透過提示鏈結、反射評估迴圈和多代理程式協同運作等工具，代理式 AI 系統可以模擬專家推理模式，例如診斷、分類、規劃或風險分析。

Amazon Nova 模型和基礎產生

使用 Amazon Nova Pro 和 Amazon Nova Premier，基礎 RAG 工作流程會延伸至多模式輸入，讓客服人員能夠解譯下列來源的和原因：

註釋的文件和 PDF 檔案
圖表、圖表和內嵌映像
螢幕擷取畫面、表單和結構化資料視覺化
影片文字記錄和投影片

此功能讓 Amazon Nova 特別適合需要深入了解豐富媒體內容的產業，例如法律案例、保險評估、臨床記錄或法規文件。

RAG 中的安全與控管

接地企業模型引入了新的責任，例如透過 RAG、知識庫或微調。您要將自己的資料和內容插入基礎模型。這除了模型選擇和提示 crafting 之外，還引入了新的責任。 AWS 建議以下控制項，這些控制項與護欄一起運作，以支援可信的企業部署：

來源資料品質保證 - 基礎回應的可靠性僅與其根據的文件、資料庫或 APIs 相同。
資料分類和可追蹤性 – 分類和標記內容來源，以顯示基礎回應的來源。
存取控制 – 將私有文件注入提示會提高安全性和隱私權風險。限制透過 IAM 存取特定文件或內嵌。
更新和偏離管理 – 基礎知識必須隨著您的業務發展。必須有版本控制、更新政策和自動重新索引，以防止模型輸出中的偏離或過時資訊。
管理內嵌智慧 – 您現在使用 AI 部署組織知識。該功能具有驗證、監控和管理表達方式的責任，尤其是在醫療保健和金融等受管制網域中。
提示可觀測性 – 基礎系統必須遵守 IP 權利、法規要求和公司免責聲明。擷取完整的提示、內容和回應鏈，以確保合規性。
稽核記錄 – 透過和結構化 CloudWatch 日誌追蹤擷取 AWS CloudTrail 和推論。
使用者意見回饋和更正迴圈 – 企業負責讓使用者標記錯誤的基礎、不正確的答案或不相關的來源，並路由該意見回饋以改善未來相關性。
記憶體控制 – 選擇是否保留工作階段的推斷洞見。
字符預算最佳化 – 接地新增大量文字區塊時，會增加字符用量（和成本）。您必須平衡 RAG 精確度和提示經濟，通常是透過區塊化、摘要或中繼資料篩選。

接地和 RAG 摘要

RAG 是安全且可擴展企業 AI 的基礎策略。透過以權威性內部知識為基礎的基礎模型，RAG 會將大型語言模型從一般用途產生器轉換為網域感知、政策一致且可解釋的 AI 助理。此方法可減少幻覺、強制執行內部政策的合規性，並啟用以事實為基礎的情境式回應，讓生成式 AI 同時適用於面向客戶和員工的應用程式。

結合自動推理和護欄時，基礎模型不僅會成為工具，還會成為負責且信任的客服人員。透過 Amazon Bedrock 無伺服器 RAG 支援和 Amazon Nova 多模式功能，組織可以在其業務中擴展安全、高效能的 AI，而無需管理基礎設施。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

AI 工作負載的模型執行策略

Edge AI 和全域推論分佈