RAG 애플리케이션을 최적화하기 위한 모범 사례 작성

Ivan Cui와 Samantha Stuart, Amazon Web Services

2025년 7월(문서 기록)

대규모 언어 모델(LLMs)은 인간과 유사한 텍스트를 이해하고 생성하는 뛰어난 능력을 갖춘 인공 지능 분야에 혁신을 가져왔습니다. 그러나 상당한 제한에 직면합니다. 훈련 데이터에 포함된 지식으로만 작업할 수 있습니다. 여기에서 Retrieval Augmented Generation(RAG)이 도움이 됩니다. LLMs을 조직의 데이터 및 문서와 같은 외부 지식 소스와 결합하는 솔루션을 제공합니다. 정보 검색 및 응답 생성과 관련된 2단계 프로세스를 통해 RAG를 통해 AI 시스템은 다양한 소스의 up-to-date 정보에 액세스하고 통합할 수 있으므로 정적 모델 지식과 동적 실제 정보 요구 사항 간의 차이를 연결하는 보다 정확하고 정보에 입각한 응답이 가능합니다.

RAG 기반 애플리케이션에서 콘텐츠를 검색하도록 최적화하려면 어떻게 해야 하나요? 이 가이드는 지식 기반에서 텍스트 기반 콘텐츠의 형식 지정 및 쓰기 스타일을 최적화하는 데 도움이 되는 모범 사례를 제공합니다. 콘텐츠를 최적화하면 컨텍스트가 향상되어 RAG 애플리케이션이 작업별 정보를 더 정확하게 이해하는 데 도움이 됩니다. 시스템에서 관련성이 높고 정확한 콘텐츠를 검색하면 LLM 응답의 품질이 향상됩니다. 시스템 수준에서 컨텍스트 전송 프로세스를 최적화하는 것을 컨텍스트 엔지니어링이라고 하며, 이는 에이전트 RAG 아키텍처의 필수적인 부분을 형성합니다. 에이전트 RAG에서 하나 이상의 추가 LLMs RAG 실행 전에 접수 요청을 고려하고 조치를 취합니다. 이렇게 하면 다단계 정보 전송 프로세스가 용이해집니다. RAG 아키텍처가 점점 더 복잡해짐에 따라 소스 콘텐츠 최적화는 LLMs. 이러한 모범 사례는 RAG 애플리케이션에 대한 조직의 투자를 극대화하는 데 도움이 되도록 설계되었습니다.

대상 독자

이 가이드는 하나 이상의 RAG 구성 요소로 LLM 애플리케이션을 구축하는 AI 엔지니어, 데이터 과학자, 데이터 엔지니어 또는 소프트웨어 개발자를 대상으로 합니다. 이 가이드의 개념과 권장 사항을 이해하려면 LLMs에 대한 벡터 데이터베이스 및 프롬프트를 숙지해야 합니다.

목표

이 가이드의 권장 사항은 다음을 달성하는 데 도움이 될 수 있습니다.

토큰 사용 및 중복성에 최적화된 체계적이고 의미론적으로 풍부한 소스 문서를 제공하여 RAG 애플리케이션에서 생성된 응답의 정확성과 관련성을 개선합니다.
소스 문서 내에 명확한 정의와 설명을 제공하여 RAG 애플리케이션이 도메인별 지식과 컨텍스트를 더 잘 이해할 수 있도록 지원합니다.
소스 문서 전반에서 일관된 형식 지정 및 구조화 지침을 준수하여 RAG 애플리케이션의 유지 관리 및 지식 기반 업데이트를 더 쉽게 수행할 수 있습니다.
대규모 모놀리식 문서를 효율적으로 인덱싱하고 검색할 수 있는 더 작은 독립형 단위로 분류하여 RAG 솔루션의 확장성을 개선합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

LLMs 및 RAG 이해