View a markdown version of this page

编写优化 RAG 应用程序的最佳实践 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

编写优化 RAG 应用程序的最佳实践

Ivan Cui 和 Samantha Stuart,Amazon Web Services

2025 年 7 月文档历史记录

大型语言模型 (LLMs) 凭借其非凡的理解和生成类人文本的能力,彻底改变了人工智能领域。但是,他们面临一个显著的局限性:他们只能使用训练数据中包含的知识。这就是检索增强生成 (RAG) 的用武之地。它提供了一种 LLMs 与外部知识来源(例如您组织的数据和文档)相结合的解决方案。通过涉及信息检索和响应生成的两阶段过程,RAG使人工智能系统能够访问和整合来自不同来源 up-to-date的信息,从而做出更准确、更明智的响应,弥合静态模型知识和动态现实世界信息需求之间的差距。

如何优化内容以便在基于 RAG 的应用程序中进行检索? 本指南提供了最佳实践,可帮助您优化知识库中基于文本的内容的格式和写作风格。优化内容可以增强上下文,从而帮助 RAG 应用程序更准确地理解特定于任务的信息。当系统检索到高度相关和准确的内容时,法学硕士的响应质量就会提高。在系统层面优化上下文交付过程称为上下文工程,它构成了代理RAG架构的重要组成部分。在 agentic RAG 中,一个或多个额外的 LLMs 理由,然后在 RAG 执行之前对录取请求采取行动。这便于多步骤的信息传送过程。随着RAG架构变得越来越复杂,源内容优化仍然是向其提供清晰上下文的最直接方法。 LLMs这些最佳实践旨在帮助您最大限度地提高组织对RAG应用程序的投资。

目标受众

本指南适用于使用一个或多个 RAG 组件构建 LLM 应用程序的 AI 工程师、数据科学家、数据工程师或软件开发人员。要理解本指南中的概念和建议,您应该熟悉矢量数据库和提示 LLMs。

目标

本指南中的建议可以帮助您实现以下目标:

  • 通过提供结构良好且语义丰富的源文档,针对令牌使用和冗余进行了优化,提高 RAG 应用程序生成的响应的准确性和相关性。

  • 通过在源文档中提供清晰的定义和解释,帮助 RAG 应用程序更好地理解特定领域的知识和上下文。

  • 通过遵守源文档中一致的格式和结构指南,便于对 RAG 应用程序进行更轻松的维护和知识库更新。

  • 通过将大型单体文档分解为可以高效索引和检索的较小、独立的单元,提高 RAG 解决方案的可扩展性。