Redacción de mejores prácticas para optimizar las aplicaciones RAG

Ivan Cui y Samantha Stuart, Amazon Web Services

Julio de 2025 (historial del documento)

Los grandes modelos lingüísticos (LLMs) han revolucionado el campo de la inteligencia artificial con su notable capacidad para comprender y generar textos de aspecto humano. Sin embargo, se enfrentan a una limitación importante: solo pueden trabajar con el conocimiento contenido en sus datos de entrenamiento. Aquí es donde la generación aumentada de recuperación (RAG) ayuda. Ofrece una solución que se combina LLMs con fuentes de conocimiento externas, como los datos y documentos de su organización. Mediante un proceso de dos etapas que incluye la recuperación de información y la generación de respuestas, el RAG permite a los sistemas de IA acceder a up-to-date información de diversas fuentes e incorporarla, lo que da como resultado respuestas más precisas e informadas que cierran la brecha entre el conocimiento de los modelos estáticos y las necesidades de información dinámicas del mundo real.

¿Cómo se puede optimizar el contenido para su recuperación en una aplicación basada en RAG? Esta guía proporciona las mejores prácticas para ayudarle a optimizar el formato y el estilo de escritura del contenido basado en texto en la base de conocimientos. La optimización del contenido mejora el contexto, lo que ayuda a las aplicaciones RAG a comprender la información específica de la tarea con mayor precisión. Cuando el sistema recupera contenido muy relevante y preciso, la calidad de la respuesta del LLM mejora. La optimización del proceso de entrega de contexto a nivel de sistema se denomina ingeniería de contexto y constituye una parte esencial de las arquitecturas RAG de las agencias. En el RAG de una agencia, hay una o más LLMs razones adicionales para actuar en función de las solicitudes recibidas antes de ejecutar el RAG. Esto facilita un proceso de entrega de información de varios pasos. A medida que las arquitecturas RAG se vuelven cada vez más complejas, la optimización del contenido fuente sigue siendo el medio más directo de ofrecer un contexto claro. LLMs Estas mejores prácticas están diseñadas para ayudarlo a maximizar la inversión de su organización en una aplicación RAG.

Destinatarios previstos

Esta guía está destinada a ingenieros de IA, científicos de datos, ingenieros de datos o desarrolladores de software que estén creando aplicaciones LLM con uno o más componentes de RAG. Para comprender los conceptos y las recomendaciones de esta guía, debe estar familiarizado con las bases de datos vectoriales y las instrucciones correspondientes. LLMs

Objetivos

Las recomendaciones de esta guía pueden ayudarle a lograr lo siguiente:

Mejore la precisión y la relevancia de las respuestas generadas por las aplicaciones RAG proporcionando documentos fuente bien estructurados y con una gran riqueza semántica, optimizados para el uso de fichas y la redundancia.
Ayude a las aplicaciones de RAG a comprender mejor el conocimiento y el contexto específicos del dominio proporcionando definiciones y explicaciones claras en los documentos fuente.
Facilite el mantenimiento y las actualizaciones de la base de conocimientos de las aplicaciones RAG al seguir las pautas de formato y estructuración uniformes en todos los documentos fuente.
Mejore la escalabilidad de las soluciones RAG dividiendo los documentos grandes y monolíticos en unidades más pequeñas e independientes que se puedan indexar y recuperar de manera eficiente.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Comprensión de los LLM y los RAG