View a markdown version of this page

근거 및 검색 증강 생성 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

근거 및 검색 증강 생성

엔터프라이즈 프로덕션 환경에서 AI 시스템을 배포하려면 신뢰, 정확성 및 설명 가능성이 필수적입니다. 파운데이션 모델(FMs 놀라운 일반 기능을 제공합니다. 그러나 대규모 퍼블릭 코포라에 대한 교육을 받았으며 독점 데이터, 비즈니스 규칙 또는 최근 변경 사항에 대한 인식이 부족한 경우가 많습니다.

이러한 인식 격차를 해결하기 위해는 Amazon Bedrock 지식 기반을 통해 Retrieval Augmented Generation(RAG)을 AWS 활성화합니다. RAG는 외부 도메인별 지식에서 FM 응답을 기반으로 하는 강력한 아키텍처 패턴으로, 사실적 정확도와 컨텍스트적 관련성을 모두 제공합니다.

RAG는 두 프로세스를 결합하여 대규모 언어 모델(LLM) 출력을 개선합니다.

  • 검색 - 의미 체계 검색 메커니즘(일반적으로 벡터 임베딩으로 구동)을 사용하여 큐레이션된 지식 소스(예: 내부 문서, 제품 설명서 및 사례 로그)에서 관련 콘텐츠를 식별합니다.

  • 생성 - 검색된 컨텍스트를 프롬프트의 일부로 LLM에 제공하여 해당 신뢰할 수 있는 정보를 기반으로 답변을 작성할 수 있도록 합니다.

이 접근 방식을 사용하면 "폐쇄형 서적" 파운데이션 모델이 재훈련 없이 큐레이션된 실시간 엔터프라이즈 데이터에 액세스할 수 있는 것처럼 작동할 수 있습니다.

예를 들어 한 직원이 내부 AI 어시스턴트에게 “우리의 여행 정책은 무엇인가요?”라고 질문합니다. 어시스턴트의 답변은 모델을 미세 조정할 필요 없이 Amazon Simple Storage Service(Amazon S3)에서 호스팅되는 인적 리소스(HR) 설명서를 사용하여 생성됩니다.

Amazon Bedrock에서의 접지

Amazon Bedrock은 지식 기반 기능을 기반으로 개발자가 인프라를 관리하지 않고도 엔터프라이즈 콘텐츠 리포지토리를 구성하고 파운데이션 모델에 연결할 수 있도록 지원합니다.

Amazon Bedrock에서 근거의 주요 기능은 다음과 같습니다.

  • 지원되는 FM 공급자를 사용한 문서 자동 임베딩

  • Amazon S3에 저장된 PDFs, HTML, Word 문서 또는 텍스트 파일에서 의미 체계 검색

  • 콘텐츠가 LLM의 컨텍스트 창에 삽입되기 때문에 미세 조정 없이 접지

  • Amazon Bedrock Agents와 협력하여 복잡한 추론 또는 다단계 도구 사용을 수행합니다.

Amazon Bedrock 지식 기반에서 지원되는 근거 소스는 다음과 같습니다.

  • Amazon S3(기본 지원) 및 Confluence, SharePoint, 또는 웹 Salesforce크롤러(평가판)

  • Amazon Aurora, Amazon OpenSearch Serverless, Amazon Neptune Analytics, , MongoDB Pinecone및 Redis Enterprise Cloud와 같은 벡터 스토어를 사용하여 미리 임베딩된 인덱스입니다.

Amazon Bedrock에서의 근거에 대한 모델 지원에는 다음이 포함됩니다.

  • Amazon Bedrock과 호환되는 모든 LLMs은 접지를 지원합니다.

  • Amazon Nova 모델은 하이브리드 검색 기술을 사용하여 텍스트, 이미지 및 비디오 전반의 근거에 최적화되어 있습니다.

  • Amazon Bedrock 에이전트는 추론 및 의사 결정을 위해 근거가 있는 출력을 추가로 오케스트레이션할 수 있습니다.

에이전트 AI와 통합

RAG는 특히 Amazon Bedrock 에이전트가 컨텍스트 인텔리전스 및 정책 인식으로 작업할 수 있도록 지원하여 에이전트와 잘 작동합니다. 다음은 에이전트 워크플로의 예입니다.

  1. 사용자 입력은 Amazon EventBridge로 전송되어 Amazon Bedrock 에이전트로 전송됩니다.

  2. 에이전트는 지식 기반을 호출하여 내부 문서를 검색합니다.

  3. 검색된 컨텍스트는 LLM 프롬프트에 포함됩니다.

  4. LLM은 참조 및 추적성을 사용하여 근거가 있는 출력을 생성합니다.

  5. (선택 사항) 에이전트는 향후 작업을 위해 출력 및 지원 증거를 메모리에 저장합니다.

이 워크플로를 통해 에이전트는 근거가 있는 컨텍스트를 추론하고 설명 가능한 결정을 내려 범용 인텔리전스와 도메인별 애플리케이션 간의 격차를 해소할 수 있습니다.

안전 및 규정 준수를 위한 가드레일 추가

근거는 정확도를 높이지만 프로덕션급 AI는 모델이 말하거나 할 수 있는 것과 없는 것에 대한 명시적 제어를 요구합니다. Amazon Bedrock Guardrails 기능은 에이전트 동작을 제한하고 엔터프라이즈 정책을 적용합니다.

가드레일의 기능은 다음과 같습니다.

  • 콘텐츠 필터 - 개인 식별 정보 마스킹을 포함하여 안전 또는 규정 준수 표준을 위반하는 출력을 방지합니다.

  • 거부 주제 - 특정 범주의 응답을 차단합니다(예: 의학적 조언 없음).

  • 프롬프트 검사 - 추론 전에 민감한 입력을 식별하고 제거합니다.

  • 사용자 수준 액세스 제어 - AWS Identity and Access Management (IAM)을 사용하여 자격 증명 및 역할을 기반으로 응답을 사용자 지정합니다.

  • 세션 컨텍스트 제약 조건 - 에이전트를 특정 작업으로 조정하여 모델 드리프트를 방지합니다.

가드레일을 사용하면 조직은 에이전트에게 추론과 의사 결정을 안전하게 위임하는 동시에 어조, 행동 및 경계를 제어할 수 있습니다.

RAG 외에 자동화된 추론

근거가 있는 콘텐츠로는 충분하지 않습니다. 에이전트는 해당 콘텐츠를 추론해야 합니다. 여기에서 LLM 기반 자동 추론이 중요해집니다. 자동 추론은 에이전트가 사람의 직접적인 개입 없이 결론 도출, 의사 결정 또는 문제 해결과 같이 논리적으로 추론할 수 있도록 하는 데 중점을 둡니다.

자동 추론을 통해 다음을 수행할 수 있습니다.

  • 합성 - 검색된 여러 문서를 비교, 대조 또는 요약합니다.

  • 다중 홉 로직 - 문서 또는 섹션 간에 사실을 연결하여 결론을 도출합니다.

  • 의사 결정 - 규칙 또는 기본 설정에 따라 충돌하는 데이터 중에서 선택합니다.

  • 증거 기반 응답 - 모든 결정에 대한 인용 및 정당화를 출력합니다.

이러한 기능은 근거 있는 응답을 추론된 답변으로 변환하고 검색 도구의 Amazon Bedrock 에이전트를 도메인 인식 어드바이저로 변환합니다.

에이전트 AI 시스템은 프롬프트 체인, 반영 평가 루프, 다중 에이전트 오케스트레이션과 같은 도구를 사용하여 진단, 분류, 계획 또는 위험 분석과 같은 전문가 추론 패턴을 시뮬레이션할 수 있습니다.

Amazon Nova 모델 및 근거 생성

Amazon Nova Pro 및 Amazon Nova Premier를 사용하면 기반 RAG 워크플로가 멀티모달 입력으로 확장되므로 에이전트는 다음 소스에서 및 추론을 해석할 수 있습니다.

  • 주석이 달린 문서 및 PDF 파일

  • 다이어그램, 차트 및 임베디드 이미지

  • 스크린샷, 양식 및 구조화된 데이터 시각화

  • 비디오 트랜스크립트 및 슬라이드 데크

이 기능을 통해 Amazon Nova는 법률 사례 작업, 보험 평가, 임상 기록 또는 규제 제출과 같은 풍부한 미디어 콘텐츠를 깊이 이해해야 하는 산업에 특히 적합합니다.

RAG의 보안 및 거버넌스

RAG, 지식 기반 또는 미세 조정을 통한 새로운 책임과 같은 엔터프라이즈 모델을 기반으로 합니다. 파운데이션 모델에 자체 데이터와 컨텍스트를 주입합니다. 이를 통해 모델 선택 및 프롬프트 crafting. AWS recommended 이상의 새로운 책임이 도입되며, 가드레일과 함께 작동하여 자신감 있는 엔터프라이즈 배포를 지원합니다.

  • 소스 데이터 품질 보증 - 기반 응답은 기반이 되는 문서, 데이터베이스 또는 APIs만큼만 신뢰할 수 있습니다.

  • 데이터 분류 및 추적성 - 콘텐츠 소스를 분류하고 태그를 지정하여 근거가 있는 응답의 출처를 표시합니다.

  • 액세스 제어 - 프롬프트에 프라이빗 문서를 삽입하면 보안 및 개인 정보 보호 위험이 높아집니다. IAM을 통해 특정 문서 또는 임베딩에 대한 액세스를 제한합니다.

  • 업데이트 및 드리프트 관리 - 기반 지식은 비즈니스에 따라 발전해야 합니다. 모델 출력에서 드리프트 또는 오래된 정보를 방지하려면 버전 관리, 최신 정책 및 자동 재인덱싱이 있어야 합니다.

  • 임베디드 인텔리전스의 거버넌스 - 이제 AI를 사용하여 조직 지식을 배포하고 있습니다. 이 기능은 특히 의료 및 재무와 같은 규제 대상 도메인에서 표현 방식을 검증, 모니터링 및 관리할 의무가 있습니다.

  • 프롬프트 관찰성 - 기반 시스템은 IP 권리, 규제 요구 사항 및 기업 면책 조항을 준수해야 합니다. 규정 준수를 위해 전체 프롬프트, 컨텍스트 및 응답 체인을 캡처합니다.

  • 감사 로깅 - 및 구조화된 CloudWatch 로그를 통해 검색 AWS CloudTrail 및 추론을 추적합니다.

  • 사용자 피드백 및 수정 루프 - 기업은 사용자가 잘못된 근거, 잘못된 답변 또는 관련 없는 소스에 플래그를 지정하고 해당 피드백을 라우팅하여 향후 관련성을 개선할 수 있도록 할 책임이 있습니다.

  • 메모리 제어 - 세션에 대해 추론된 인사이트를 유지할지 여부를 선택합니다.

  • 토큰 예산 최적화 - 근거가 큰 텍스트 청크를 추가하면 토큰 사용량(및 비용)이 증가합니다. 종종 청킹, 요약 또는 메타데이터 필터링을 통해 RAG 정밀도와 프롬프트 경제의 균형을 맞춰야 합니다.

근거 및 RAG 요약

RAG는 안전하고 확장 가능한 엔터프라이즈 AI를 위한 기본 전략입니다. RAG는 신뢰할 수 있는 내부 지식을 바탕으로 파운데이션 모델을 범용 생성기에서 도메인 인식, 정책 조정 및 설명 가능한 AI 어시스턴트로 변환합니다. 이 접근 방식은 할루시네이션을 줄이고, 내부 정책 준수를 적용하며, 사실 기반의 상황별 대응을 가능하게 하여 생성형 AI를 고객 대면 애플리케이션과 직원 대면 애플리케이션 모두에 적합하게 만듭니다.

자동화된 추론 및 가드레일과 결합하면 기반 모델은 도구뿐만 아니라 책임감 있고 신뢰할 수 있는 에이전트가 됩니다. Amazon Bedrock 서버리스 RAG 지원 및 Amazon Nova 멀티모달 기능을 통해 조직은 인프라를 관리하지 않고도 비즈니스 전반에 걸쳐 안전한 고성능 AI를 확장할 수 있습니다.