

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 撰寫最佳實務以最佳化 RAG 應用程式
<a name="introduction"></a>

*Ivan Cui 和 Samantha Stuart，Amazon Web Services*

*2025 年 7 月* ([文件歷史記錄](doc-history.md))

大型語言模型 LLMs) 已徹底改變人工智慧領域，並具備絕佳的能力來了解和產生類似人類的文字。不過，他們面臨重大限制：他們只能使用訓練資料中包含的知識。這是 [Retrieval Augmented Generation (RAG)](https://aws.amazon.com/what-is/retrieval-augmented-generation/) 提供協助之處。它提供結合 LLMs與外部知識來源的解決方案，例如您組織的資料和文件。透過涉及資訊擷取和回應產生的兩階段程序，RAG 可讓 AI 系統存取和整合來自各種來源up-to-date，從而產生更準確和明智的回應，從而消除靜態模型知識和動態真實世界資訊需求之間的差距。

如何最佳化 RAG 型應用程式中擷取的內容？ 本指南提供最佳實務，協助您最佳化知識庫中文字型內容的格式和撰寫樣式。最佳化內容可增強內容，協助 RAG 應用程式更準確地了解任務特定資訊。當系統擷取高度相關且準確的內容時，LLM 回應的品質就會改善。在系統層級最佳化內容交付程序稱為*內容工程*，它構成代理 RAG 架構的重要部分。在代理程式 RAG 中，一或多個額外的 LLMs原因，並在 RAG 執行之前處理接收請求。這有助於多步驟資訊交付程序。隨著 RAG 架構越來越複雜，來源內容最佳化仍然是為 LLMs提供清晰內容的最直接方式。這些最佳實務旨在協助您將組織對 RAG 應用程式的投資最大化。

## 目標對象
<a name="introduction-audience"></a>

本指南適用於使用一或多個 RAG 元件建置 LLM 應用程式的 AI 工程師、資料科學家、資料工程師或軟體開發人員。若要了解本指南中的概念和建議，您應該熟悉向量資料庫和 LLMs 的提示。

## 目標
<a name="introduction-objectives"></a>

本指南中的建議可協助您達成下列目標：
+ 提供結構完善且語意豐富的來源文件，針對字符用量和備援進行最佳化，以改善 RAG 應用程式產生的回應的準確性和相關性。
+ 透過在來源文件中提供明確的定義和說明，協助 RAG 應用程式更深入了解特定領域的知識和內容。
+ 透過遵循跨來源文件的一致格式和結構準則，簡化 RAG 應用程式的維護和知識庫更新。
+ 將大型單體文件分解為可有效編製索引和擷取的小型獨立單位，以改善 RAG 解決方案的可擴展性。