기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 벡터 데이터베이스 비교
<a name="vector-db-comparison"></a>

AWS 는 개별 벡터 데이터베이스부터 완전 관리형 서비스인 Amazon Bedrock 지식 기반에 이르기까지 벡터 검색 기능을 구현하기 위한 여러 접근 방식을 제공합니다. 이러한 옵션을 평가할 때 조직은 아키텍처, 확장성, 통합 기능, 성능 특성 및 보안 기능을 비롯한 다양한 측면을 고려해야 합니다.

## 개별 벡터 데이터베이스
<a name="individual-vector-databases"></a>

다음 표에서는 아키텍처, 조정 기능, 데이터 소스 통합 및 성능 특성에 중점을 둔 여러 AWS 개별 벡터 데이터베이스 솔루션의 주요 기능에 대한 개요를 제공합니다.


| 
| 
| **Feature** | **Amazon Kendra** | **Amazon OpenSearch Service** | **pgvector를 PostgreSQLwith ** | **Amazon DocumentDB** | **Amazon MemoryDB** | **Amazon Neptune Analytics** | **Amazon S3 Vectors** | 
| --- |--- |--- |--- |--- |--- |--- |--- |
| 기본 사용 사례 | 엔터프라이즈 검색 및 RAG | 분산 검색 및 분석 | 벡터가 지원되는 관계형 DB | 벡터 검색이 포함된 문서 DB | 실시간 인 메모리 벡터 검색 | 벡터 검색을 사용한 그래프 분석 | 비용 최적화 벡터 스토리지 | 
| 아키텍처 | 완전관리형 | 분산 클러스터 | 관계형 데이터베이스 | 문서 지향 | 인 메모리 데이터베이스 | 그래프 분석 엔진 | 서버리스 객체 스토리지 | 
| 데이터 모델 | 문서 기반 | JSON 문서 | 관계형 테이블 | JSON 문서 | JSON을 사용한 키-값 | 속성 그래프 | 객체 스토리지 | 
| 벡터 차원 | 자동으로 관리됨 | 최대 16,000개 | 구성 가능 | 최대 2,000(인덱싱됨), 16,000(인덱싱되지 않음) | 최대 32,768 | 구성 가능 | 최대 4,096 | 
| 인덱싱 방법 | 자동 | HNSW, IVF | HNSW, IVFFlat | HNSW, IVFFlat | HNSW | 네이티브 그래프 및 벡터 | 자동 | 
| 거리 지표 | 자동 | 코사인, 유클리드, 점 제품 | 코사인, 유클리드, 내부 제품 | 코사인, 유클리드, 점 제품 | 코사인, 유클리드, 내부 제품 | 코사인, 유클리드 | 코사인, 유클리드 | 
| 쿼리 지연 시간 | 1초 미만 | Sub-10(GPU 가속) | 10\~100ms | 밀리초 | 1밀리초 미만 | 1초 미만 | Sub-100  | 
| 크기 조정 모델 | 자동 | 가로(노드 추가) | 수직 및 읽기 전용 복제본 | 가로(인스턴스 추가) | 수직 및 복제본 | 자동 | 자동(서버리스) | 
| 최대 벡터 | 관리형 | 수십억(클러스터 종속) | 수백만(인스턴스에 따라 다름) | 컬렉션당 수백만 개 | 데이터베이스당 수백만 | 수십억 | 인덱스당 20억 개, 버킷당 인덱스 10,000개 | 
| 처리량 | 높음 | 매우 높음( 수천 QPS) | 중간 | 높음 | 매우 높음(하루에 수백만 개의 요청) | 높음 | 중간(빈번하지 않은 쿼리에 최적화됨) | 
| 데이터 내구성 | 99.999999999%(11 9초) | 복제본으로 구성 가능 | 99.99%(다중 AZ) | 99.99%(다중 AZ) | 99.99%(다중 AZ) | 99.99% | 99.999999999%(11 9초) | 
| 일관성 모델 | 최종 | 최종(구성 가능) | 강력한 (ACID) | 최종 | 강함 | 강함 | 강함 | 
| 추가 기능 | 40개 이상의 데이터 커넥터, NLP | 전체 텍스트 검색, 분석, 대시보드 | SQL 쿼리, ACID 트랜잭션 | MongoDB API 호환성 | Redis API 호환성, 캐싱 | 그래프 알고리즘, 순회 | Amazon S3 통합, 수명 주기 정책 | 
| 요금 모델 | 쿼리 및 스토리지당 지불 | 인스턴스 시간 및 스토리지 | 인스턴스 시간 및 스토리지 | 인스턴스 시간 및 스토리지 | 인스턴스 시간 및 스토리지 | 용량 단위 및 스토리지 | 스토리지, 쿼리 및 데이터 전송 | 
| 비용 최적화 | 사용량 기반 | 예약 인스턴스, Auto Scaling | 예약 인스턴스, Aurora Serverless | 예약 인스턴스 | 예약 인스턴스 | Auto Scaling | 특수 DBs 대비 최대 90% 절감 | 
| 최적의 용도 | 최소한의 설정으로 엔터프라이즈 검색 | 처리량이 많고 지연 시간이 짧은 쿼리 | 하이브리드 SQL 및 벡터 워크로드 | 벡터가 필요한 MongoDB 호환 앱 | 지연 시간이 매우 짧은 실시간 앱 | GraphRAG 및 지식 그래프 | 장기적이고 비용 효율적인 스토리지 | 
| 이상적인 쿼리 패턴 | 빈번한 엔터프라이즈 검색 | 고주파 실시간 쿼리 | 혼합 SQL 및 벡터 쿼리 | 의미 체계 검색을 사용하여 쿼리 문서화 | 하루에 수백만 개의 요청 | 벡터 검색을 사용한 그래프 순회 | 자주 수행하지 않는 쿼리(분\~시간) | 
| 설정 복잡성 | 낮음(완전 관리형) | 중간(클러스터 구성) | 중간(확장 설정) | 중간(클러스터 구성) | 중간(클러스터 구성) | 낮음(완전 관리형) | 낮음(서버리스) | 
| 팀 전문 지식 필요 | 최소화 | OpenSearch 또는 Elasticsearch | PostgreSQL, SQL | MongoDB | Redis | 그래프 데이터베이스 | Amazon S3, 기본 벡터 개념 | 

## 관리형 서비스 - Amazon Bedrock 지식 기반
<a name="managed-service"></a>

Amazon Bedrock 지식 기반은 다양한 벡터 스토리지 옵션을 갖춘 완전관리형 솔루션을 제공합니다. 다음 표에서는 이러한 스토리지 옵션을 비교합니다.


| 
| 
| **Feature** | **pgvector를 PostgreSQLwith ** | **Neptune 분석** | **OpenSearch Service Serverless** | **Amazon S3 벡터** | **Pinecone** | **RedisEnterprise 클라우드** | 
| --- |--- |--- |--- |--- |--- |--- |
| 기본 사용 사례 | 벡터 RAG를 사용한 관계형 DB | GraphRAG에 대한 그래프 기반 벡터 검색 | 지식 관리 RAG | 비용 최적화 벡터 RAG | 고성능 벡터 검색 | 인 메모리 벡터 검색 | 
| 아키텍처 | 완전 관리형 관계형 | 완전 관리형 그래프 분석 | 완전 관리형 서버리스 | 서버리스 객체 스토리지 | 완전 관리형 하이브리드 클라우드 | 완전 관리형 인 메모리 | 
| 데이터 모델 | 관계형 테이블 | 속성 그래프 | JSON 문서 | 객체 스토리지 | 목적별 벡터 | 벡터가 있는 키-값 | 
| 벡터 스토리지 | pgvector 확장을 통해 | 네이티브 그래프 벡터 | OpenSearch 엔진을 통해 | 네이티브 Amazon S3 벡터 스토리지 | 네이티브 벡터 데이터베이스 | 인 메모리 벡터 | 
| Amazon Bedrock 통합 | 기본 | 기본 | 기본 | 기본 | 기본 | 기본 | 
| 자동 수집 | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 
| 자동 벡터화 | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 예(Amazon Bedrock을 통해) | 
| 규모 조정 | Auto Scaling(Aurora Serverless) | 자동 그래프 조정 | 자동 서버리스 | 자동(벡터 수십억 개) | Auto Scaling 포드 | 클러스터 자동 크기 조정 | 
| 쿼리 성능 | 관계형 또는 벡터의 경우 높음 | 그래프 벡터의 경우 높음 | 높음 | 중간(100ms 이상 지연 시간) | 매우 높음 | 매우 높음 | 
| 최대 벡터 | 수백만(인스턴스에 따라 다름) | 수십억 | 수십억 | 인덱스당 20억 | 수십억 | 수백만(메모리에 따라 다름) | 
| 추가 기능 | SQL 쿼리, ACID 트랜잭션 | 그래프 알고리즘, 순회 | 전체 텍스트 검색, 분석 | Amazon S3 수명 주기, 계층화 | 메타데이터 필터링, 네임스페이스 | Redis 데이터 구조, 캐싱 | 
| 비용 최적화 | 보통(Aurora Serverless) | 보통(용량 단위) | 높음(서버리스, pay-per-use) | 매우 높음(최대 90% 절감) | 보통(포드 기반 요금) | 낮음(인 메모리 프리미엄) | 
| 최적의 용도 | 하이브리드 SQL/벡터 워크로드 | 연결된 지식 그래프 | 벡터 검색이 포함된 전체 텍스트 | 장기적이고 액세스 빈도가 낮은 벡터 | 대규모 실시간 벡터 검색 | 지연 시간이 매우 짧은 요구 사항 | 
| 이상적인 쿼리 패턴 | 혼합 SQL 및 벡터 쿼리 | 벡터를 사용한 그래프 순회 | 분석을 통한 빈번한 검색 | 자주 검색하지 않음(분\~시간) | 고주파 실시간 쿼리 | 초당 수백만 개의 요청 | 
| Amazon Bedrock을 사용한 설정 | 단순(Amazon Bedrock에서 관리) | 단순(Amazon Bedrock에서 관리) | 단순(Amazon Bedrock에서 관리) | 단순(Amazon Bedrock에서 관리) | 단순(Amazon Bedrock에서 관리) | 단순(Amazon Bedrock에서 관리) | 
| 데이터 레지던시 | AWS 리전 | AWS 리전 | AWS 리전 | AWS 리전 | 멀티 클라우드(AWS 및 기타) | 멀티 클라우드(AWS 및 기타) | 
| 요금 모델 | 인스턴스 시간 및 스토리지 | 용량 단위 및 스토리지 | 컴퓨팅 및 스토리지(서버리스) | 스토리지, 쿼리 및 전송 | 포드 시간 및 스토리지 | 노드 시간 및 스토리지 | 

## 개별 옵션과 관리형 옵션 중에서 선택
<a name="decision-matrix"></a>


| 
| 
| **고려 사항** | **개별 벡터 DB 선택** | **Amazon Bedrock 지식 기반(관리형) 선택** | 
| --- |--- |--- |
| RAG 구현 | RAG 파이프라인을 완전히 제어하려는 경우 | 최소한의 설정으로 완전 관리형 RAG를 원하는 경우 | 
| 사용자 지정 | 사용자 지정 검색 로직 및 사전 처리가 필요합니다. | 요구 사항을 충족하는 표준 RAG 패턴 | 
| 기존 인프라 | 데이터베이스가 이미 배포되어 있습니다. | 새로 시작하거나 간소화된 관리를 원하는 경우 | 
| 팀 전문 지식 | 팀에 데이터베이스 관리 전문 지식이 있음 | 인프라가 아닌 애플리케이션 로직에 집중하는 것을 선호합니다. | 
| 통합 복잡성 | 기존 시스템과의 심층 통합이 필요합니다. | Amazon Bedrock 모델과 빠르게 통합하려는 경우 | 
| 운영 오버헤드 | 데이터베이스 작업을 관리할 수 있습니다. | 작업을 처리 AWS 하려는 경우 | 
| 비용 구조 | 직접 데이터베이스 요금을 선호합니다. | 통합 Amazon Bedrock 요금을 선호합니다. | 
| 출시 시간 | 사용자 지정 구현 시간이 있습니다. | 빠른 배포가 필요합니다. |