本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
撰寫最佳實務以最佳化 RAG 應用程式
Ivan Cui 和 Samantha Stuart,Amazon Web Services
2025 年 7 月 (文件歷史記錄)
大型語言模型 LLMs) 已徹底改變人工智慧領域,並具備絕佳的能力來了解和產生類似人類的文字。不過,他們面臨重大限制:他們只能使用訓練資料中包含的知識。這是 Retrieval Augmented Generation (RAG)
如何最佳化 RAG 型應用程式中擷取的內容? 本指南提供最佳實務,協助您最佳化知識庫中文字型內容的格式和撰寫樣式。最佳化內容可增強內容,協助 RAG 應用程式更準確地了解任務特定資訊。當系統擷取高度相關且準確的內容時,LLM 回應的品質就會改善。在系統層級最佳化內容交付程序稱為內容工程,它構成代理 RAG 架構的重要部分。在代理程式 RAG 中,一或多個額外的 LLMs原因,並在 RAG 執行之前處理接收請求。這有助於多步驟資訊交付程序。隨著 RAG 架構越來越複雜,來源內容最佳化仍然是為 LLMs提供清晰內容的最直接方式。這些最佳實務旨在協助您將組織對 RAG 應用程式的投資最大化。
目標對象
本指南適用於使用一或多個 RAG 元件建置 LLM 應用程式的 AI 工程師、資料科學家、資料工程師或軟體開發人員。若要了解本指南中的概念和建議,您應該熟悉向量資料庫和 LLMs 的提示。
目標
本指南中的建議可協助您達成下列目標:
-
提供結構完善且語意豐富的來源文件,針對字符用量和備援進行最佳化,以改善 RAG 應用程式產生的回應的準確性和相關性。
-
透過在來源文件中提供明確的定義和說明,協助 RAG 應用程式更深入了解特定領域的知識和內容。
-
透過遵循跨來源文件的一致格式和結構準則,簡化 RAG 應用程式的維護和知識庫更新。
-
將大型單體文件分解為可有效編製索引和擷取的小型獨立單位,以改善 RAG 解決方案的可擴展性。