개별 벡터 데이터베이스 관리형 서비스 - Amazon Bedrock 지식 기반 개별 옵션과 관리형 옵션 중에서 선택

벡터 데이터베이스 비교

AWS 는 개별 벡터 데이터베이스부터 완전 관리형 서비스인 Amazon Bedrock 지식 기반에 이르기까지 벡터 검색 기능을 구현하기 위한 여러 접근 방식을 제공합니다. 이러한 옵션을 평가할 때 조직은 아키텍처, 확장성, 통합 기능, 성능 특성 및 보안 기능을 비롯한 다양한 측면을 고려해야 합니다.

개별 벡터 데이터베이스

다음 표에서는 아키텍처, 조정 기능, 데이터 소스 통합 및 성능 특성에 중점을 둔 여러 AWS 개별 벡터 데이터베이스 솔루션의 주요 기능에 대한 개요를 제공합니다.

Feature	Amazon Kendra	Amazon OpenSearch Service	pgvector를 PostgreSQLwith	Amazon DocumentDB	Amazon MemoryDB	Amazon Neptune Analytics	Amazon S3 Vectors
기본 사용 사례	엔터프라이즈 검색 및 RAG	분산 검색 및 분석	벡터가 지원되는 관계형 DB	벡터 검색이 포함된 문서 DB	실시간 인 메모리 벡터 검색	벡터 검색을 사용한 그래프 분석	비용 최적화 벡터 스토리지
아키텍처	완전관리형	분산 클러스터	관계형 데이터베이스	문서 지향	인 메모리 데이터베이스	그래프 분석 엔진	서버리스 객체 스토리지
데이터 모델	문서 기반	JSON 문서	관계형 테이블	JSON 문서	JSON을 사용한 키-값	속성 그래프	객체 스토리지
벡터 차원	자동으로 관리됨	최대 16,000개	구성 가능	최대 2,000(인덱싱됨), 16,000(인덱싱되지 않음)	최대 32,768	구성 가능	최대 4,096
인덱싱 방법	자동	HNSW, IVF	HNSW, IVFFlat	HNSW, IVFFlat	HNSW	네이티브 그래프 및 벡터	자동
거리 지표	자동	코사인, 유클리드, 점 제품	코사인, 유클리드, 내부 제품	코사인, 유클리드, 점 제품	코사인, 유클리드, 내부 제품	코사인, 유클리드	코사인, 유클리드
쿼리 지연 시간	1초 미만	Sub-10(GPU 가속)	10~100ms	밀리초	1밀리초 미만	1초 미만	Sub-100
크기 조정 모델	자동	가로(노드 추가)	수직 및 읽기 전용 복제본	가로(인스턴스 추가)	수직 및 복제본	자동	자동(서버리스)
최대 벡터	관리형	수십억(클러스터 종속)	수백만(인스턴스에 따라 다름)	컬렉션당 수백만 개	데이터베이스당 수백만	수십억	인덱스당 20억 개, 버킷당 인덱스 10,000개
처리량	높음	매우 높음( 수천 QPS)	중간	높음	매우 높음(하루에 수백만 개의 요청)	높음	중간(빈번하지 않은 쿼리에 최적화됨)
데이터 내구성	99.999999999%(11 9초)	복제본으로 구성 가능	99.99%(다중 AZ)	99.99%(다중 AZ)	99.99%(다중 AZ)	99.99%	99.999999999%(11 9초)
일관성 모델	최종	최종(구성 가능)	강력한 (ACID)	최종	강함	강함	강함
추가 기능	40개 이상의 데이터 커넥터, NLP	전체 텍스트 검색, 분석, 대시보드	SQL 쿼리, ACID 트랜잭션	MongoDB API 호환성	Redis API 호환성, 캐싱	그래프 알고리즘, 순회	Amazon S3 통합, 수명 주기 정책
요금 모델	쿼리 및 스토리지당 지불	인스턴스 시간 및 스토리지	인스턴스 시간 및 스토리지	인스턴스 시간 및 스토리지	인스턴스 시간 및 스토리지	용량 단위 및 스토리지	스토리지, 쿼리 및 데이터 전송
비용 최적화	사용량 기반	예약 인스턴스, Auto Scaling	예약 인스턴스, Aurora Serverless	예약 인스턴스	예약 인스턴스	Auto Scaling	특수 DBs 대비 최대 90% 절감
최적의 용도	최소한의 설정으로 엔터프라이즈 검색	처리량이 많고 지연 시간이 짧은 쿼리	하이브리드 SQL 및 벡터 워크로드	벡터가 필요한 MongoDB 호환 앱	지연 시간이 매우 짧은 실시간 앱	GraphRAG 및 지식 그래프	장기적이고 비용 효율적인 스토리지
이상적인 쿼리 패턴	빈번한 엔터프라이즈 검색	고주파 실시간 쿼리	혼합 SQL 및 벡터 쿼리	의미 체계 검색을 사용하여 쿼리 문서화	하루에 수백만 개의 요청	벡터 검색을 사용한 그래프 순회	자주 수행하지 않는 쿼리(분~시간)
설정 복잡성	낮음(완전 관리형)	중간(클러스터 구성)	중간(확장 설정)	중간(클러스터 구성)	중간(클러스터 구성)	낮음(완전 관리형)	낮음(서버리스)
팀 전문 지식 필요	최소화	OpenSearch 또는 Elasticsearch	PostgreSQL, SQL	MongoDB	Redis	그래프 데이터베이스	Amazon S3, 기본 벡터 개념

관리형 서비스 - Amazon Bedrock 지식 기반

Amazon Bedrock 지식 기반은 다양한 벡터 스토리지 옵션을 갖춘 완전관리형 솔루션을 제공합니다. 다음 표에서는 이러한 스토리지 옵션을 비교합니다.

Feature	pgvector를 PostgreSQLwith	Neptune 분석	OpenSearch Service Serverless	Amazon S3 벡터	Pinecone	RedisEnterprise 클라우드
기본 사용 사례	벡터 RAG를 사용한 관계형 DB	GraphRAG에 대한 그래프 기반 벡터 검색	지식 관리 RAG	비용 최적화 벡터 RAG	고성능 벡터 검색	인 메모리 벡터 검색
아키텍처	완전 관리형 관계형	완전 관리형 그래프 분석	완전 관리형 서버리스	서버리스 객체 스토리지	완전 관리형 하이브리드 클라우드	완전 관리형 인 메모리
데이터 모델	관계형 테이블	속성 그래프	JSON 문서	객체 스토리지	목적별 벡터	벡터가 있는 키-값
벡터 스토리지	pgvector 확장을 통해	네이티브 그래프 벡터	OpenSearch 엔진을 통해	네이티브 Amazon S3 벡터 스토리지	네이티브 벡터 데이터베이스	인 메모리 벡터
Amazon Bedrock 통합	기본	기본	기본	기본	기본	기본
자동 수집	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)
자동 벡터화	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)	예(Amazon Bedrock을 통해)
규모 조정	Auto Scaling(Aurora Serverless)	자동 그래프 조정	자동 서버리스	자동(벡터 수십억 개)	Auto Scaling 포드	클러스터 자동 크기 조정
쿼리 성능	관계형 또는 벡터의 경우 높음	그래프 벡터의 경우 높음	높음	중간(100ms 이상 지연 시간)	매우 높음	매우 높음
최대 벡터	수백만(인스턴스에 따라 다름)	수십억	수십억	인덱스당 20억	수십억	수백만(메모리에 따라 다름)
추가 기능	SQL 쿼리, ACID 트랜잭션	그래프 알고리즘, 순회	전체 텍스트 검색, 분석	Amazon S3 수명 주기, 계층화	메타데이터 필터링, 네임스페이스	Redis 데이터 구조, 캐싱
비용 최적화	보통(Aurora Serverless)	보통(용량 단위)	높음(서버리스, pay-per-use)	매우 높음(최대 90% 절감)	보통(포드 기반 요금)	낮음(인 메모리 프리미엄)
최적의 용도	하이브리드 SQL/벡터 워크로드	연결된 지식 그래프	벡터 검색이 포함된 전체 텍스트	장기적이고 액세스 빈도가 낮은 벡터	대규모 실시간 벡터 검색	지연 시간이 매우 짧은 요구 사항
이상적인 쿼리 패턴	혼합 SQL 및 벡터 쿼리	벡터를 사용한 그래프 순회	분석을 통한 빈번한 검색	자주 검색하지 않음(분~시간)	고주파 실시간 쿼리	초당 수백만 개의 요청
Amazon Bedrock을 사용한 설정	단순(Amazon Bedrock에서 관리)	단순(Amazon Bedrock에서 관리)	단순(Amazon Bedrock에서 관리)	단순(Amazon Bedrock에서 관리)	단순(Amazon Bedrock에서 관리)	단순(Amazon Bedrock에서 관리)
데이터 레지던시	AWS 리전	AWS 리전	AWS 리전	AWS 리전	멀티 클라우드(AWS 및 기타)	멀티 클라우드(AWS 및 기타)
요금 모델	인스턴스 시간 및 스토리지	용량 단위 및 스토리지	컴퓨팅 및 스토리지(서버리스)	스토리지, 쿼리 및 전송	포드 시간 및 스토리지	노드 시간 및 스토리지

개별 옵션과 관리형 옵션 중에서 선택

고려 사항	개별 벡터 DB 선택	Amazon Bedrock 지식 기반(관리형) 선택
RAG 구현	RAG 파이프라인을 완전히 제어하려는 경우	최소한의 설정으로 완전 관리형 RAG를 원하는 경우
사용자 지정	사용자 지정 검색 로직 및 사전 처리가 필요합니다.	요구 사항을 충족하는 표준 RAG 패턴
기존 인프라	데이터베이스가 이미 배포되어 있습니다.	새로 시작하거나 간소화된 관리를 원하는 경우
팀 전문 지식	팀에 데이터베이스 관리 전문 지식이 있음	인프라가 아닌 애플리케이션 로직에 집중하는 것을 선호합니다.
통합 복잡성	기존 시스템과의 심층 통합이 필요합니다.	Amazon Bedrock 모델과 빠르게 통합하려는 경우
운영 오버헤드	데이터베이스 작업을 관리할 수 있습니다.	작업을 처리 AWS 하려는 경우
비용 구조	직접 데이터베이스 요금을 선호합니다.	통합 Amazon Bedrock 요금을 선호합니다.
출시 시간	사용자 지정 구현 시간이 있습니다.	빠른 배포가 필요합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

벡터 데이터베이스 옵션

비용 비교 및 고려 사항