常見問答集

為什麼最佳化 RAG 應用程式的文件很重要？

原始文件通常寫入供人類使用，而不考慮進階 AI 系統的需求，例如擷取增強生成 (RAG) 應用程式。遵循最佳實務來最佳化文件，可透過為模型提供結構化、明確且相關的資訊，大幅提升 RAG 應用程式的效能和準確性。

一些關鍵挑戰包括缺乏結構化格式和中繼資料、非正式或不一致的語言、語彙和備援、模棱兩可的詞彙和片語、包含超連結元素，以及缺乏特定網域的內容。這些問題可能會混淆 RAG 模型，並導致不正確或不相關的回應。如需詳細資訊，請參閱本指南中影響 RAG 應用程式來源資料的挑戰。

清楚的標題和子標題可協助 RAG 模型了解內容的結構和內容。這使他們能夠更好地從文件中導覽和擷取相關資訊，並改善產生的回應品質。如需詳細資訊，請參閱本指南中的 RAG 應用程式的文件最佳實務。

RAG 模型解譯資料表可能具有挑戰性，因為它們需要了解二維結構。在平面語法或項目符號清單中呈現資料表資訊，有助於模型更輕鬆地處理資訊，進而獲得更好的效能。如需詳細資訊，請參閱本指南中的 RAG 應用程式的文件最佳實務。

在每個區段或子區段的開頭包含簡潔摘要，可以增加語意涵蓋範圍並強化關鍵點。這可提高內嵌空間內相似性搜尋的準確性，最終增強 RAG 應用程式的效能。如需詳細資訊，請參閱本指南中的 RAG 應用程式的文件最佳實務。

LLMs會根據廣泛的資料進行訓練，但缺乏企業特定縮寫或術語的內容。定義縮寫並提供內容有助於 LLMs 更準確地了解和回應。這有助於防止幻覺或誤解。如需詳細資訊，請參閱本指南中的 RAG 應用程式的文件最佳實務。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

最佳實務

後續步驟和資源