Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Redacción de mejores prácticas para optimizar las aplicaciones RAG
Ivan Cui y Samantha Stuart, Amazon Web Services
Julio de 2025 (historial del documento)
Los grandes modelos lingüísticos (LLMs) han revolucionado el campo de la inteligencia artificial con su notable capacidad para comprender y generar textos de aspecto humano. Sin embargo, se enfrentan a una limitación importante: solo pueden trabajar con el conocimiento contenido en sus datos de entrenamiento. Aquí es donde la generación aumentada de recuperación (RAG) ayuda.
¿Cómo se puede optimizar el contenido para su recuperación en una aplicación basada en RAG? Esta guía proporciona las mejores prácticas para ayudarle a optimizar el formato y el estilo de escritura del contenido basado en texto en la base de conocimientos. La optimización del contenido mejora el contexto, lo que ayuda a las aplicaciones RAG a comprender la información específica de la tarea con mayor precisión. Cuando el sistema recupera contenido muy relevante y preciso, la calidad de la respuesta del LLM mejora. La optimización del proceso de entrega de contexto a nivel de sistema se denomina ingeniería de contexto y constituye una parte esencial de las arquitecturas RAG de las agencias. En el RAG de una agencia, hay una o más LLMs razones adicionales para actuar en función de las solicitudes recibidas antes de ejecutar el RAG. Esto facilita un proceso de entrega de información de varios pasos. A medida que las arquitecturas RAG se vuelven cada vez más complejas, la optimización del contenido fuente sigue siendo el medio más directo de ofrecer un contexto claro. LLMs Estas mejores prácticas están diseñadas para ayudarlo a maximizar la inversión de su organización en una aplicación RAG.
Destinatarios previstos
Esta guía está destinada a ingenieros de IA, científicos de datos, ingenieros de datos o desarrolladores de software que estén creando aplicaciones LLM con uno o más componentes de RAG. Para comprender los conceptos y las recomendaciones de esta guía, debe estar familiarizado con las bases de datos vectoriales y las instrucciones correspondientes. LLMs
Objetivos
Las recomendaciones de esta guía pueden ayudarle a lograr lo siguiente:
-
Mejore la precisión y la relevancia de las respuestas generadas por las aplicaciones RAG proporcionando documentos fuente bien estructurados y con una gran riqueza semántica, optimizados para el uso de fichas y la redundancia.
-
Ayude a las aplicaciones de RAG a comprender mejor el conocimiento y el contexto específicos del dominio proporcionando definiciones y explicaciones claras en los documentos fuente.
-
Facilite el mantenimiento y las actualizaciones de la base de conocimientos de las aplicaciones RAG al seguir las pautas de formato y estructuración uniformes en todos los documentos fuente.
-
Mejore la escalabilidad de las soluciones RAG dividiendo los documentos grandes y monolíticos en unidades más pequeñas e independientes que se puedan indexar y recuperar de manera eficiente.