编写优化 RAG 应用程序的最佳实践

Ivan Cui 和 Samantha Stuart，Amazon Web Services

2025 年 7 月（文档历史记录）

大型语言模型 (LLMs) 凭借其非凡的理解和生成类人文本的能力，彻底改变了人工智能领域。但是，他们面临一个显著的局限性：他们只能使用训练数据中包含的知识。这就是检索增强生成 (RAG) 的用武之地。它提供了一种 LLMs 与外部知识来源（例如您组织的数据和文档）相结合的解决方案。通过涉及信息检索和响应生成的两阶段过程，RAG使人工智能系统能够访问和整合来自不同来源 up-to-date的信息，从而做出更准确、更明智的响应，弥合静态模型知识和动态现实世界信息需求之间的差距。

如何优化内容以便在基于 RAG 的应用程序中进行检索？本指南提供了最佳实践，可帮助您优化知识库中基于文本的内容的格式和写作风格。优化内容可以增强上下文，从而帮助 RAG 应用程序更准确地理解特定于任务的信息。当系统检索到高度相关和准确的内容时，法学硕士的响应质量就会提高。在系统层面优化上下文交付过程称为上下文工程，它构成了代理RAG架构的重要组成部分。在 agentic RAG 中，一个或多个额外的 LLMs 理由，然后在 RAG 执行之前对录取请求采取行动。这便于多步骤的信息传送过程。随着RAG架构变得越来越复杂，源内容优化仍然是向其提供清晰上下文的最直接方法。 LLMs这些最佳实践旨在帮助您最大限度地提高组织对RAG应用程序的投资。

目标受众

本指南适用于使用一个或多个 RAG 组件构建 LLM 应用程序的 AI 工程师、数据科学家、数据工程师或软件开发人员。要理解本指南中的概念和建议，您应该熟悉矢量数据库和提示 LLMs。

目标

本指南中的建议可以帮助您实现以下目标：

通过提供结构良好且语义丰富的源文档，针对令牌使用和冗余进行了优化，提高 RAG 应用程序生成的响应的准确性和相关性。
通过在源文档中提供清晰的定义和解释，帮助 RAG 应用程序更好地理解特定领域的知识和上下文。
通过遵守源文档中一致的格式和结构指南，便于对 RAG 应用程序进行更轻松的维护和知识库更新。
通过将大型单体文档分解为可以高效索引和检索的较小、独立的单元，提高 RAG 解决方案的可扩展性。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

了解 LLM 和 RAG