本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
编写优化 RAG 应用程序的最佳实践
Ivan Cui 和 Samantha Stuart,Amazon Web Services
2025 年 7 月(文档历史记录)
大型语言模型 (LLMs) 凭借其非凡的理解和生成类人文本的能力,彻底改变了人工智能领域。但是,他们面临一个显著的局限性:他们只能使用训练数据中包含的知识。这就是检索增强生成 (RAG)
如何优化内容以便在基于 RAG 的应用程序中进行检索? 本指南提供了最佳实践,可帮助您优化知识库中基于文本的内容的格式和写作风格。优化内容可以增强上下文,从而帮助 RAG 应用程序更准确地理解特定于任务的信息。当系统检索到高度相关和准确的内容时,法学硕士的响应质量就会提高。在系统层面优化上下文交付过程称为上下文工程,它构成了代理RAG架构的重要组成部分。在 agentic RAG 中,一个或多个额外的 LLMs 理由,然后在 RAG 执行之前对录取请求采取行动。这便于多步骤的信息传送过程。随着RAG架构变得越来越复杂,源内容优化仍然是向其提供清晰上下文的最直接方法。 LLMs这些最佳实践旨在帮助您最大限度地提高组织对RAG应用程序的投资。
目标受众
本指南适用于使用一个或多个 RAG 组件构建 LLM 应用程序的 AI 工程师、数据科学家、数据工程师或软件开发人员。要理解本指南中的概念和建议,您应该熟悉矢量数据库和提示 LLMs。
目标
本指南中的建议可以帮助您实现以下目标:
-
通过提供结构良好且语义丰富的源文档,针对令牌使用和冗余进行了优化,提高 RAG 应用程序生成的响应的准确性和相关性。
-
通过在源文档中提供清晰的定义和解释,帮助 RAG 应用程序更好地理解特定领域的知识和上下文。
-
通过遵守源文档中一致的格式和结构指南,便于对 RAG 应用程序进行更轻松的维护和知识库更新。
-
通过将大型单体文档分解为可以高效索引和检索的较小、独立的单元,提高 RAG 解决方案的可扩展性。