View a markdown version of this page

FAQ - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

FAQ

RAG 애플리케이션용 문서를 최적화하는 것이 중요한 이유는 무엇입니까?

원시 문서는 검색 증강 생성(RAG) 애플리케이션과 같은 고급 AI 시스템의 요구 사항을 고려하지 않고 사람이 사용할 수 있도록 작성되는 경우가 많습니다. 모범 사례를 따라 문서를 최적화하면 모델에 체계적이고 모호하지 않은 관련 정보를 제공하여 RAG 애플리케이션의 성능과 정확도를 크게 개선할 수 있습니다.

RAG 성능을 저해할 수 있는 원시 문서의 일반적인 문제는 무엇입니까?

일부 주요 과제로는 구조화된 형식 및 메타데이터 부족, 비공식적이거나 일관되지 않은 언어, 세부 정보 및 중복성, 모호한 용어 및 문구, 하이퍼링크 요소 포함, 도메인별 컨텍스트 부족 등이 있습니다. 이러한 문제는 RAG 모델을 혼동하여 부정확하거나 관련이 없는 응답으로 이어질 수 있습니다. 자세한 내용은이 설명서의 RAG 애플리케이션에 영향을 미치는 소스 데이터의 문제를 참조하세요.

제목 및 하위 제목을 사용하면 RAG 성능이 어떻게 향상될 수 있습니까?

명확한 제목과 하위 제목은 RAG 모델이 콘텐츠의 구조와 컨텍스트를 이해하는 데 도움이 됩니다. 이를 통해 문서에서 관련 정보를 더 잘 탐색하고 추출할 수 있으며 생성된 응답의 품질을 개선할 수 있습니다. 자세한 내용은이 가이드의 RAG 애플리케이션에 대한 설명서 모범 사례를 참조하세요.

테이블 정보를 플랫 레벨 구문으로 바꾸는 것이 권장되는 이유는 무엇입니까?

RAG 모델은 2차원 구조를 이해해야 하므로 테이블을 해석하기 어려울 수 있습니다. 플랫 레벨 구문 또는 글머리 기호 목록에 테이블 정보를 제공하면 모델이 정보를 보다 쉽게 처리할 수 있으므로 성능이 향상됩니다. 자세한 내용은이 가이드의 RAG 애플리케이션에 대한 설명서 모범 사례를 참조하세요.

요약을 추가하면 RAG 성능이 어떻게 향상될 수 있나요?

각 섹션 또는 하위 섹션의 시작 부분에 간결한 요약을 포함하면 의미 체계 적용 범위를 늘리고 핵심 사항을 강화할 수 있습니다. 이렇게 하면 임베딩 공간 내에서 유사성 검색의 정확도가 향상되어 궁극적으로 RAG 애플리케이션의 성능이 향상됩니다. 자세한 내용은이 가이드의 RAG 애플리케이션에 대한 설명서 모범 사례를 참조하세요.

약어를 정의하고 LLMs에 대한 컨텍스트를 설정하는 것이 중요한 이유는 무엇입니까?

LLMs은 광범위한 데이터에 대해 훈련되지만 엔터프라이즈별 약어 또는 용어에 대한 컨텍스트가 부족합니다. 약어를 정의하고 컨텍스트를 제공하면 LLMs 더 정확하게 이해하고 대응할 수 있습니다. 이렇게 하면 할루시네이션이나 오해를 방지하는 데 도움이 될 수 있습니다. 자세한 내용은이 가이드의 RAG 애플리케이션에 대한 설명서 모범 사례를 참조하세요.