View a markdown version of this page

常見問答集 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

常見問答集

為什麼最佳化 RAG 應用程式的文件很重要?

原始文件通常寫入供人類使用,而不考慮進階 AI 系統的需求,例如擷取增強生成 (RAG) 應用程式。遵循最佳實務來最佳化文件,可透過為模型提供結構化、明確且相關的資訊,大幅提升 RAG 應用程式的效能和準確性。

原始文件可能會阻礙 RAG 效能的常見挑戰有哪些?

一些關鍵挑戰包括缺乏結構化格式和中繼資料、非正式或不一致的語言、語彙和備援、模棱兩可的詞彙和片語、包含超連結元素,以及缺乏特定網域的內容。這些問題可能會混淆 RAG 模型,並導致不正確或不相關的回應。如需詳細資訊,請參閱本指南中影響 RAG 應用程式來源資料的挑戰

使用標題和子標題如何改善 RAG 效能?

清楚的標題和子標題可協助 RAG 模型了解內容的結構和內容。這使他們能夠更好地從文件中導覽和擷取相關資訊,並改善產生的回應品質。如需詳細資訊,請參閱本指南中的 RAG 應用程式的文件最佳實務

為什麼建議使用平面語法取代資料表資訊?

RAG 模型解譯資料表可能具有挑戰性,因為它們需要了解二維結構。在平面語法或項目符號清單中呈現資料表資訊,有助於模型更輕鬆地處理資訊,進而獲得更好的效能。如需詳細資訊,請參閱本指南中的 RAG 應用程式的文件最佳實務

新增摘要如何增強 RAG 效能?

在每個區段或子區段的開頭包含簡潔摘要,可以增加語意涵蓋範圍並強化關鍵點。這可提高內嵌空間內相似性搜尋的準確性,最終增強 RAG 應用程式的效能。如需詳細資訊,請參閱本指南中的 RAG 應用程式的文件最佳實務

為什麼定義 LLMs 的縮寫和設定內容很重要?

LLMs會根據廣泛的資料進行訓練,但缺乏企業特定縮寫或術語的內容。定義縮寫並提供內容有助於 LLMs 更準確地了解和回應。這有助於防止幻覺或誤解。如需詳細資訊,請參閱本指南中的 RAG 應用程式的文件最佳實務