撰寫最佳實務以最佳化 RAG 應用程式

Ivan Cui 和 Samantha Stuart，Amazon Web Services

2025 年 7 月 (文件歷史記錄)

大型語言模型 LLMs) 已徹底改變人工智慧領域，並具備絕佳的能力來了解和產生類似人類的文字。不過，他們面臨重大限制：他們只能使用訓練資料中包含的知識。這是 Retrieval Augmented Generation (RAG) 提供協助之處。它提供結合 LLMs與外部知識來源的解決方案，例如您組織的資料和文件。透過涉及資訊擷取和回應產生的兩階段程序，RAG 可讓 AI 系統存取和整合來自各種來源up-to-date，從而產生更準確和明智的回應，從而消除靜態模型知識和動態真實世界資訊需求之間的差距。

如何最佳化 RAG 型應用程式中擷取的內容？本指南提供最佳實務，協助您最佳化知識庫中文字型內容的格式和撰寫樣式。最佳化內容可增強內容，協助 RAG 應用程式更準確地了解任務特定資訊。當系統擷取高度相關且準確的內容時，LLM 回應的品質就會改善。在系統層級最佳化內容交付程序稱為內容工程，它構成代理 RAG 架構的重要部分。在代理程式 RAG 中，一或多個額外的 LLMs原因，並在 RAG 執行之前處理接收請求。這有助於多步驟資訊交付程序。隨著 RAG 架構越來越複雜，來源內容最佳化仍然是為 LLMs提供清晰內容的最直接方式。這些最佳實務旨在協助您將組織對 RAG 應用程式的投資最大化。

目標對象

本指南適用於使用一或多個 RAG 元件建置 LLM 應用程式的 AI 工程師、資料科學家、資料工程師或軟體開發人員。若要了解本指南中的概念和建議，您應該熟悉向量資料庫和 LLMs 的提示。

目標

本指南中的建議可協助您達成下列目標：

提供結構完善且語意豐富的來源文件，針對字符用量和備援進行最佳化，以改善 RAG 應用程式產生的回應的準確性和相關性。
透過在來源文件中提供明確的定義和說明，協助 RAG 應用程式更深入了解特定領域的知識和內容。
透過遵循跨來源文件的一致格式和結構準則，簡化 RAG 應用程式的維護和知識庫更新。
將大型單體文件分解為可有效編製索引和擷取的小型獨立單位，以改善 RAG 解決方案的可擴展性。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

了解 LLMs和 RAG