기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
벡터 데이터베이스 비교
AWS 는 개별 벡터 데이터베이스부터 완전 관리형 서비스인 Amazon Bedrock 지식 기반에 이르기까지 벡터 검색 기능을 구현하기 위한 여러 접근 방식을 제공합니다. 이러한 옵션을 평가할 때 조직은 아키텍처, 확장성, 통합 기능, 성능 특성 및 보안 기능을 비롯한 다양한 측면을 고려해야 합니다.
개별 벡터 데이터베이스
다음 표에서는 아키텍처, 조정 기능, 데이터 소스 통합 및 성능 특성에 중점을 둔 여러 AWS 개별 벡터 데이터베이스 솔루션의 주요 기능에 대한 개요를 제공합니다.
Feature |
Amazon Kendra |
Amazon OpenSearch Service |
pgvector를 PostgreSQLwith |
Amazon DocumentDB |
Amazon MemoryDB |
Amazon Neptune Analytics |
Amazon S3 Vectors |
|---|---|---|---|---|---|---|---|
기본 사용 사례 |
엔터프라이즈 검색 및 RAG |
분산 검색 및 분석 |
벡터가 지원되는 관계형 DB |
벡터 검색이 포함된 문서 DB |
실시간 인 메모리 벡터 검색 |
벡터 검색을 사용한 그래프 분석 |
비용 최적화 벡터 스토리지 |
아키텍처 |
완전관리형 |
분산 클러스터 |
관계형 데이터베이스 |
문서 지향 |
인 메모리 데이터베이스 |
그래프 분석 엔진 |
서버리스 객체 스토리지 |
데이터 모델 |
문서 기반 |
JSON 문서 |
관계형 테이블 |
JSON 문서 |
JSON을 사용한 키-값 |
속성 그래프 |
객체 스토리지 |
벡터 차원 |
자동으로 관리됨 |
최대 16,000개 |
구성 가능 |
최대 2,000(인덱싱됨), 16,000(인덱싱되지 않음) |
최대 32,768 |
구성 가능 |
최대 4,096 |
인덱싱 방법 |
자동 |
HNSW, IVF |
HNSW, IVFFlat |
HNSW, IVFFlat |
HNSW |
네이티브 그래프 및 벡터 |
자동 |
거리 지표 |
자동 |
코사인, 유클리드, 점 제품 |
코사인, 유클리드, 내부 제품 |
코사인, 유클리드, 점 제품 |
코사인, 유클리드, 내부 제품 |
코사인, 유클리드 |
코사인, 유클리드 |
쿼리 지연 시간 |
1초 미만 |
Sub-10(GPU 가속) |
10~100ms |
밀리초 |
1밀리초 미만 |
1초 미만 |
Sub-100 |
크기 조정 모델 |
자동 |
가로(노드 추가) |
수직 및 읽기 전용 복제본 |
가로(인스턴스 추가) |
수직 및 복제본 |
자동 |
자동(서버리스) |
최대 벡터 |
관리형 |
수십억(클러스터 종속) |
수백만(인스턴스에 따라 다름) |
컬렉션당 수백만 개 |
데이터베이스당 수백만 |
수십억 |
인덱스당 20억 개, 버킷당 인덱스 10,000개 |
처리량 |
높음 |
매우 높음( 수천 QPS) |
중간 |
높음 |
매우 높음(하루에 수백만 개의 요청) |
높음 |
중간(빈번하지 않은 쿼리에 최적화됨) |
데이터 내구성 |
99.999999999%(11 9초) |
복제본으로 구성 가능 |
99.99%(다중 AZ) |
99.99%(다중 AZ) |
99.99%(다중 AZ) |
99.99% |
99.999999999%(11 9초) |
일관성 모델 |
최종 |
최종(구성 가능) |
강력한 (ACID) |
최종 |
강함 |
강함 |
강함 |
추가 기능 |
40개 이상의 데이터 커넥터, NLP |
전체 텍스트 검색, 분석, 대시보드 |
SQL 쿼리, ACID 트랜잭션 |
MongoDB API 호환성 |
Redis API 호환성, 캐싱 |
그래프 알고리즘, 순회 |
Amazon S3 통합, 수명 주기 정책 |
요금 모델 |
쿼리 및 스토리지당 지불 |
인스턴스 시간 및 스토리지 |
인스턴스 시간 및 스토리지 |
인스턴스 시간 및 스토리지 |
인스턴스 시간 및 스토리지 |
용량 단위 및 스토리지 |
스토리지, 쿼리 및 데이터 전송 |
비용 최적화 |
사용량 기반 |
예약 인스턴스, Auto Scaling |
예약 인스턴스, Aurora Serverless |
예약 인스턴스 |
예약 인스턴스 |
Auto Scaling |
특수 DBs 대비 최대 90% 절감 |
최적의 용도 |
최소한의 설정으로 엔터프라이즈 검색 |
처리량이 많고 지연 시간이 짧은 쿼리 |
하이브리드 SQL 및 벡터 워크로드 |
벡터가 필요한 MongoDB 호환 앱 |
지연 시간이 매우 짧은 실시간 앱 |
GraphRAG 및 지식 그래프 |
장기적이고 비용 효율적인 스토리지 |
이상적인 쿼리 패턴 |
빈번한 엔터프라이즈 검색 |
고주파 실시간 쿼리 |
혼합 SQL 및 벡터 쿼리 |
의미 체계 검색을 사용하여 쿼리 문서화 |
하루에 수백만 개의 요청 |
벡터 검색을 사용한 그래프 순회 |
자주 수행하지 않는 쿼리(분~시간) |
설정 복잡성 |
낮음(완전 관리형) |
중간(클러스터 구성) |
중간(확장 설정) |
중간(클러스터 구성) |
중간(클러스터 구성) |
낮음(완전 관리형) |
낮음(서버리스) |
팀 전문 지식 필요 |
최소화 |
OpenSearch 또는 Elasticsearch |
PostgreSQL, SQL |
MongoDB |
Redis |
그래프 데이터베이스 |
Amazon S3, 기본 벡터 개념 |
관리형 서비스 - Amazon Bedrock 지식 기반
Amazon Bedrock 지식 기반은 다양한 벡터 스토리지 옵션을 갖춘 완전관리형 솔루션을 제공합니다. 다음 표에서는 이러한 스토리지 옵션을 비교합니다.
Feature |
pgvector를 PostgreSQLwith |
Neptune 분석 |
OpenSearch Service Serverless |
Amazon S3 벡터 |
Pinecone |
RedisEnterprise 클라우드 |
|---|---|---|---|---|---|---|
기본 사용 사례 |
벡터 RAG를 사용한 관계형 DB |
GraphRAG에 대한 그래프 기반 벡터 검색 |
지식 관리 RAG |
비용 최적화 벡터 RAG |
고성능 벡터 검색 |
인 메모리 벡터 검색 |
아키텍처 |
완전 관리형 관계형 |
완전 관리형 그래프 분석 |
완전 관리형 서버리스 |
서버리스 객체 스토리지 |
완전 관리형 하이브리드 클라우드 |
완전 관리형 인 메모리 |
데이터 모델 |
관계형 테이블 |
속성 그래프 |
JSON 문서 |
객체 스토리지 |
목적별 벡터 |
벡터가 있는 키-값 |
벡터 스토리지 |
pgvector 확장을 통해 |
네이티브 그래프 벡터 |
OpenSearch 엔진을 통해 |
네이티브 Amazon S3 벡터 스토리지 |
네이티브 벡터 데이터베이스 |
인 메모리 벡터 |
Amazon Bedrock 통합 |
기본 |
기본 |
기본 |
기본 |
기본 |
기본 |
자동 수집 |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
자동 벡터화 |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
예(Amazon Bedrock을 통해) |
규모 조정 |
Auto Scaling(Aurora Serverless) |
자동 그래프 조정 |
자동 서버리스 |
자동(벡터 수십억 개) |
Auto Scaling 포드 |
클러스터 자동 크기 조정 |
쿼리 성능 |
관계형 또는 벡터의 경우 높음 |
그래프 벡터의 경우 높음 |
높음 |
중간(100ms 이상 지연 시간) |
매우 높음 |
매우 높음 |
최대 벡터 |
수백만(인스턴스에 따라 다름) |
수십억 |
수십억 |
인덱스당 20억 |
수십억 |
수백만(메모리에 따라 다름) |
추가 기능 |
SQL 쿼리, ACID 트랜잭션 |
그래프 알고리즘, 순회 |
전체 텍스트 검색, 분석 |
Amazon S3 수명 주기, 계층화 |
메타데이터 필터링, 네임스페이스 |
Redis 데이터 구조, 캐싱 |
비용 최적화 |
보통(Aurora Serverless) |
보통(용량 단위) |
높음(서버리스, pay-per-use) |
매우 높음(최대 90% 절감) |
보통(포드 기반 요금) |
낮음(인 메모리 프리미엄) |
최적의 용도 |
하이브리드 SQL/벡터 워크로드 |
연결된 지식 그래프 |
벡터 검색이 포함된 전체 텍스트 |
장기적이고 액세스 빈도가 낮은 벡터 |
대규모 실시간 벡터 검색 |
지연 시간이 매우 짧은 요구 사항 |
이상적인 쿼리 패턴 |
혼합 SQL 및 벡터 쿼리 |
벡터를 사용한 그래프 순회 |
분석을 통한 빈번한 검색 |
자주 검색하지 않음(분~시간) |
고주파 실시간 쿼리 |
초당 수백만 개의 요청 |
Amazon Bedrock을 사용한 설정 |
단순(Amazon Bedrock에서 관리) |
단순(Amazon Bedrock에서 관리) |
단순(Amazon Bedrock에서 관리) |
단순(Amazon Bedrock에서 관리) |
단순(Amazon Bedrock에서 관리) |
단순(Amazon Bedrock에서 관리) |
데이터 레지던시 |
AWS 리전 |
AWS 리전 |
AWS 리전 |
AWS 리전 |
멀티 클라우드(AWS 및 기타) |
멀티 클라우드(AWS 및 기타) |
요금 모델 |
인스턴스 시간 및 스토리지 |
용량 단위 및 스토리지 |
컴퓨팅 및 스토리지(서버리스) |
스토리지, 쿼리 및 전송 |
포드 시간 및 스토리지 |
노드 시간 및 스토리지 |
개별 옵션과 관리형 옵션 중에서 선택
고려 사항 |
개별 벡터 DB 선택 |
Amazon Bedrock 지식 기반(관리형) 선택 |
|---|---|---|
RAG 구현 |
RAG 파이프라인을 완전히 제어하려는 경우 |
최소한의 설정으로 완전 관리형 RAG를 원하는 경우 |
사용자 지정 |
사용자 지정 검색 로직 및 사전 처리가 필요합니다. |
요구 사항을 충족하는 표준 RAG 패턴 |
기존 인프라 |
데이터베이스가 이미 배포되어 있습니다. |
새로 시작하거나 간소화된 관리를 원하는 경우 |
팀 전문 지식 |
팀에 데이터베이스 관리 전문 지식이 있음 |
인프라가 아닌 애플리케이션 로직에 집중하는 것을 선호합니다. |
통합 복잡성 |
기존 시스템과의 심층 통합이 필요합니다. |
Amazon Bedrock 모델과 빠르게 통합하려는 경우 |
운영 오버헤드 |
데이터베이스 작업을 관리할 수 있습니다. |
작업을 처리 AWS 하려는 경우 |
비용 구조 |
직접 데이터베이스 요금을 선호합니다. |
통합 Amazon Bedrock 요금을 선호합니다. |
출시 시간 |
사용자 지정 구현 시간이 있습니다. |
빠른 배포가 필요합니다. |