View a markdown version of this page

FAQ - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

FAQ

Pourquoi est-il important d'optimiser les documents pour les applications RAG ?

Les documents bruts sont souvent rédigés pour la consommation humaine sans tenir compte des exigences des systèmes d'intelligence artificielle avancés, tels que les applications RAG (Retrieval Augmented Generation). L'optimisation des documents en suivant les meilleures pratiques peut améliorer de manière significative les performances et la précision des applications RAG en fournissant des informations structurées, claires et pertinentes aux modèles.

Quels sont les problèmes courants liés aux documents bruts qui peuvent nuire aux performances de RAG ?

Parmi les principaux défis, citons le manque de mise en forme et de métadonnées structurées, le langage informel ou incohérent, la verbosité et la redondance, les termes et expressions ambigus, l'inclusion d'éléments d'hyperliens et l'absence de contexte spécifique au domaine. Ces problèmes peuvent semer la confusion dans les modèles RAG et entraîner des réponses inexactes ou non pertinentes. Pour plus d'informations, consultez la section Défis liés aux données source qui affectent les applications RAG dans ce guide.

Comment l'utilisation de titres et de sous-titres peut-elle améliorer les performances du RAG ?

Des titres et sous-titres clairs aident les modèles RAG à comprendre la structure et le contexte du contenu. Cela leur permet de mieux naviguer et d'extraire les informations pertinentes des documents et d'améliorer la qualité des réponses générées. Pour plus d'informations, consultez la section Bonnes pratiques relatives à la documentation pour les applications RAG dans ce guide.

Pourquoi est-il recommandé de remplacer les informations du tableau par une syntaxe de niveau plat ?

Il peut être difficile pour les modèles RAG d'interpréter les tableaux car ils nécessitent une compréhension de la structure bidimensionnelle. La présentation des informations des tableaux sous forme de syntaxe plate ou de liste à puces permet aux modèles de traiter plus facilement les informations, ce qui améliore les performances. Pour plus d'informations, consultez la section Bonnes pratiques relatives à la documentation pour les applications RAG dans ce guide.

Comment l'ajout de résumés peut-il améliorer les performances du RAG ?

L'inclusion de résumés concis au début de chaque section ou sous-section peut accroître la couverture sémantique et renforcer les points clés. Cela améliore la précision des recherches de similarité dans l'espace d'intégration, ce qui améliore en fin de compte les performances de l'application RAG. Pour plus d'informations, consultez la section Bonnes pratiques relatives à la documentation pour les applications RAG dans ce guide.

Pourquoi est-il important de définir des abréviations et d'en définir le contexte ? LLMs

LLMs sont formés sur un large éventail de données, mais ils manquent de contexte pour les abréviations ou la terminologie propres à l'entreprise. La définition d'abréviations et la mise en contexte aident à LLMs comprendre et à répondre avec plus de précision. Cela peut aider à prévenir les hallucinations ou les interprétations erronées. Pour plus d'informations, consultez la section Bonnes pratiques relatives à la documentation pour les applications RAG dans ce guide.