View a markdown version of this page

벡터 데이터베이스 비교 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

벡터 데이터베이스 비교

AWS 는 개별 벡터 데이터베이스부터 완전 관리형 서비스인 Amazon Bedrock 지식 기반에 이르기까지 벡터 검색 기능을 구현하기 위한 여러 접근 방식을 제공합니다. 이러한 옵션을 평가할 때 조직은 아키텍처, 확장성, 통합 기능, 성능 특성 및 보안 기능을 비롯한 다양한 측면을 고려해야 합니다.

개별 벡터 데이터베이스

다음 표에서는 아키텍처, 조정 기능, 데이터 소스 통합 및 성능 특성에 중점을 둔 여러 AWS 개별 벡터 데이터베이스 솔루션의 주요 기능에 대한 개요를 제공합니다.

Feature

Amazon Kendra

Amazon OpenSearch Service

pgvector를 PostgreSQLwith

Amazon DocumentDB

Amazon MemoryDB

Amazon Neptune Analytics

Amazon S3 Vectors

기본 사용 사례

엔터프라이즈 검색 및 RAG

분산 검색 및 분석

벡터가 지원되는 관계형 DB

벡터 검색이 포함된 문서 DB

실시간 인 메모리 벡터 검색

벡터 검색을 사용한 그래프 분석

비용 최적화 벡터 스토리지

아키텍처

완전관리형

분산 클러스터

관계형 데이터베이스

문서 지향

인 메모리 데이터베이스

그래프 분석 엔진

서버리스 객체 스토리지

데이터 모델

문서 기반

JSON 문서

관계형 테이블

JSON 문서

JSON을 사용한 키-값

속성 그래프

객체 스토리지

벡터 차원

자동으로 관리됨

최대 16,000개

구성 가능

최대 2,000(인덱싱됨), 16,000(인덱싱되지 않음)

최대 32,768

구성 가능

최대 4,096

인덱싱 방법

자동

HNSW, IVF

HNSW, IVFFlat

HNSW, IVFFlat

HNSW

네이티브 그래프 및 벡터

자동

거리 지표

자동

코사인, 유클리드, 점 제품

코사인, 유클리드, 내부 제품

코사인, 유클리드, 점 제품

코사인, 유클리드, 내부 제품

코사인, 유클리드

코사인, 유클리드

쿼리 지연 시간

1초 미만

Sub-10(GPU 가속)

10~100ms

밀리초

1밀리초 미만

1초 미만

Sub-100

크기 조정 모델

자동

가로(노드 추가)

수직 및 읽기 전용 복제본

가로(인스턴스 추가)

수직 및 복제본

자동

자동(서버리스)

최대 벡터

관리형

수십억(클러스터 종속)

수백만(인스턴스에 따라 다름)

컬렉션당 수백만 개

데이터베이스당 수백만

수십억

인덱스당 20억 개, 버킷당 인덱스 10,000개

처리량

높음

매우 높음( 수천 QPS)

중간

높음

매우 높음(하루에 수백만 개의 요청)

높음

중간(빈번하지 않은 쿼리에 최적화됨)

데이터 내구성

99.999999999%(11 9초)

복제본으로 구성 가능

99.99%(다중 AZ)

99.99%(다중 AZ)

99.99%(다중 AZ)

99.99%

99.999999999%(11 9초)

일관성 모델

최종

최종(구성 가능)

강력한 (ACID)

최종

강함

강함

강함

추가 기능

40개 이상의 데이터 커넥터, NLP

전체 텍스트 검색, 분석, 대시보드

SQL 쿼리, ACID 트랜잭션

MongoDB API 호환성

Redis API 호환성, 캐싱

그래프 알고리즘, 순회

Amazon S3 통합, 수명 주기 정책

요금 모델

쿼리 및 스토리지당 지불

인스턴스 시간 및 스토리지

인스턴스 시간 및 스토리지

인스턴스 시간 및 스토리지

인스턴스 시간 및 스토리지

용량 단위 및 스토리지

스토리지, 쿼리 및 데이터 전송

비용 최적화

사용량 기반

예약 인스턴스, Auto Scaling

예약 인스턴스, Aurora Serverless

예약 인스턴스

예약 인스턴스

Auto Scaling

특수 DBs 대비 최대 90% 절감

최적의 용도

최소한의 설정으로 엔터프라이즈 검색

처리량이 많고 지연 시간이 짧은 쿼리

하이브리드 SQL 및 벡터 워크로드

벡터가 필요한 MongoDB 호환 앱

지연 시간이 매우 짧은 실시간 앱

GraphRAG 및 지식 그래프

장기적이고 비용 효율적인 스토리지

이상적인 쿼리 패턴

빈번한 엔터프라이즈 검색

고주파 실시간 쿼리

혼합 SQL 및 벡터 쿼리

의미 체계 검색을 사용하여 쿼리 문서화

하루에 수백만 개의 요청

벡터 검색을 사용한 그래프 순회

자주 수행하지 않는 쿼리(분~시간)

설정 복잡성

낮음(완전 관리형)

중간(클러스터 구성)

중간(확장 설정)

중간(클러스터 구성)

중간(클러스터 구성)

낮음(완전 관리형)

낮음(서버리스)

팀 전문 지식 필요

최소화

OpenSearch 또는 Elasticsearch

PostgreSQL, SQL

MongoDB

Redis

그래프 데이터베이스

Amazon S3, 기본 벡터 개념

관리형 서비스 - Amazon Bedrock 지식 기반

Amazon Bedrock 지식 기반은 다양한 벡터 스토리지 옵션을 갖춘 완전관리형 솔루션을 제공합니다. 다음 표에서는 이러한 스토리지 옵션을 비교합니다.

Feature

pgvector를 PostgreSQLwith

Neptune 분석

OpenSearch Service Serverless

Amazon S3 벡터

Pinecone

RedisEnterprise 클라우드

기본 사용 사례

벡터 RAG를 사용한 관계형 DB

GraphRAG에 대한 그래프 기반 벡터 검색

지식 관리 RAG

비용 최적화 벡터 RAG

고성능 벡터 검색

인 메모리 벡터 검색

아키텍처

완전 관리형 관계형

완전 관리형 그래프 분석

완전 관리형 서버리스

서버리스 객체 스토리지

완전 관리형 하이브리드 클라우드

완전 관리형 인 메모리

데이터 모델

관계형 테이블

속성 그래프

JSON 문서

객체 스토리지

목적별 벡터

벡터가 있는 키-값

벡터 스토리지

pgvector 확장을 통해

네이티브 그래프 벡터

OpenSearch 엔진을 통해

네이티브 Amazon S3 벡터 스토리지

네이티브 벡터 데이터베이스

인 메모리 벡터

Amazon Bedrock 통합

기본

기본

기본

기본

기본

기본

자동 수집

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

자동 벡터화

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

예(Amazon Bedrock을 통해)

규모 조정

Auto Scaling(Aurora Serverless)

자동 그래프 조정

자동 서버리스

자동(벡터 수십억 개)

Auto Scaling 포드

클러스터 자동 크기 조정

쿼리 성능

관계형 또는 벡터의 경우 높음

그래프 벡터의 경우 높음

높음

중간(100ms 이상 지연 시간)

매우 높음

매우 높음

최대 벡터

수백만(인스턴스에 따라 다름)

수십억

수십억

인덱스당 20억

수십억

수백만(메모리에 따라 다름)

추가 기능

SQL 쿼리, ACID 트랜잭션

그래프 알고리즘, 순회

전체 텍스트 검색, 분석

Amazon S3 수명 주기, 계층화

메타데이터 필터링, 네임스페이스

Redis 데이터 구조, 캐싱

비용 최적화

보통(Aurora Serverless)

보통(용량 단위)

높음(서버리스, pay-per-use)

매우 높음(최대 90% 절감)

보통(포드 기반 요금)

낮음(인 메모리 프리미엄)

최적의 용도

하이브리드 SQL/벡터 워크로드

연결된 지식 그래프

벡터 검색이 포함된 전체 텍스트

장기적이고 액세스 빈도가 낮은 벡터

대규모 실시간 벡터 검색

지연 시간이 매우 짧은 요구 사항

이상적인 쿼리 패턴

혼합 SQL 및 벡터 쿼리

벡터를 사용한 그래프 순회

분석을 통한 빈번한 검색

자주 검색하지 않음(분~시간)

고주파 실시간 쿼리

초당 수백만 개의 요청

Amazon Bedrock을 사용한 설정

단순(Amazon Bedrock에서 관리)

단순(Amazon Bedrock에서 관리)

단순(Amazon Bedrock에서 관리)

단순(Amazon Bedrock에서 관리)

단순(Amazon Bedrock에서 관리)

단순(Amazon Bedrock에서 관리)

데이터 레지던시

AWS 리전

AWS 리전

AWS 리전

AWS 리전

멀티 클라우드(AWS 및 기타)

멀티 클라우드(AWS 및 기타)

요금 모델

인스턴스 시간 및 스토리지

용량 단위 및 스토리지

컴퓨팅 및 스토리지(서버리스)

스토리지, 쿼리 및 전송

포드 시간 및 스토리지

노드 시간 및 스토리지

개별 옵션과 관리형 옵션 중에서 선택

고려 사항

개별 벡터 DB 선택

Amazon Bedrock 지식 기반(관리형) 선택

RAG 구현

RAG 파이프라인을 완전히 제어하려는 경우

최소한의 설정으로 완전 관리형 RAG를 원하는 경우

사용자 지정

사용자 지정 검색 로직 및 사전 처리가 필요합니다.

요구 사항을 충족하는 표준 RAG 패턴

기존 인프라

데이터베이스가 이미 배포되어 있습니다.

새로 시작하거나 간소화된 관리를 원하는 경우

팀 전문 지식

팀에 데이터베이스 관리 전문 지식이 있음

인프라가 아닌 애플리케이션 로직에 집중하는 것을 선호합니다.

통합 복잡성

기존 시스템과의 심층 통합이 필요합니다.

Amazon Bedrock 모델과 빠르게 통합하려는 경우

운영 오버헤드

데이터베이스 작업을 관리할 수 있습니다.

작업을 처리 AWS 하려는 경우

비용 구조

직접 데이터베이스 요금을 선호합니다.

통합 Amazon Bedrock 요금을 선호합니다.

출시 시간

사용자 지정 구현 시간이 있습니다.

빠른 배포가 필요합니다.