View a markdown version of this page

Preguntas frecuentes - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preguntas frecuentes

¿Por qué es importante optimizar los documentos para las aplicaciones RAG?

Los documentos sin procesar suelen escribirse para el consumo humano sin tener en cuenta los requisitos de los sistemas de IA avanzados, como las aplicaciones de recuperación aumentada (RAG). La optimización de los documentos siguiendo las mejores prácticas puede mejorar significativamente el rendimiento y la precisión de las aplicaciones RAG al proporcionar información estructurada, inequívoca y relevante a los modelos.

¿Cuáles son algunos de los desafíos más comunes relacionados con los documentos sin procesar que pueden afectar el rendimiento del RAG?

Algunos desafíos clave incluyen la falta de formatos y metadatos estructurados, el lenguaje informal o incoherente, la verbosidad y la redundancia, los términos y frases ambiguos, la inclusión de elementos de hipervínculos y la falta de un contexto específico para el dominio. Estos problemas pueden confundir los modelos RAG y dar lugar a respuestas inexactas o irrelevantes. Para obtener más información, consulte los desafíos de los datos de origen que afectan a las aplicaciones de RAG en esta guía.

¿Cómo puede el uso de encabezados y subtítulos mejorar el rendimiento de los RAG?

Los encabezados y subtítulos claros ayudan a los modelos RAG a entender la estructura y el contexto del contenido. Esto les permite navegar mejor y extraer la información relevante de los documentos y mejora la calidad de las respuestas generadas. Para obtener más información, consulte la documentación sobre las prácticas recomendadas para las aplicaciones RAG en esta guía.

¿Por qué se recomienda sustituir la información de las tablas por una sintaxis de nivel plano?

Para los modelos RAG, interpretar las tablas puede resultar difícil porque requieren una comprensión de la estructura bidimensional. Presentar la información de las tablas en una sintaxis de nivel plano o en una lista con viñetas ayuda a los modelos a procesar la información con mayor facilidad, lo que se traduce en un mejor rendimiento. Para obtener más información, consulte la documentación sobre las prácticas recomendadas para las aplicaciones RAG en esta guía.

¿Cómo puede la adición de resúmenes mejorar el rendimiento de los RAG?

Incluir resúmenes concisos al principio de cada sección o subsección puede aumentar la cobertura semántica y reforzar los puntos clave. Esto mejora la precisión de las búsquedas de similitud dentro del espacio de incrustación, lo que, en última instancia, mejora el rendimiento de la aplicación RAG. Para obtener más información, consulte la documentación sobre las prácticas recomendadas para las aplicaciones RAG en esta guía.

¿Por qué es importante definir las abreviaturas y establecer el contexto? LLMs

LLMs están formados en una amplia gama de datos, pero carecen de contexto para utilizar abreviaturas o terminología específicas de cada empresa. Definir abreviaturas y proporcionar contexto ayuda a LLMs comprender y responder con mayor precisión. Esto puede ayudar a prevenir alucinaciones o interpretaciones erróneas. Para obtener más información, consulte la documentación sobre las prácticas recomendadas para las aplicaciones RAG en esta guía.