

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 벡터 데이터베이스 옵션
<a name="vector-db-options"></a>

AWS 는 생성형 AI 애플리케이션의 다양한 사용 사례 및 요구 사항을 지원하는 다양한 벡터 데이터베이스 솔루션을 제공합니다. 이러한 옵션은 개별 데이터베이스 서비스 및 관리형 서비스 상품으로 광범위하게 분류할 수 있으며, 각 서비스에는 고유한 특성과 장점이 있습니다. 이러한 옵션을 이해하는 것은 최적의 성능, 확장성 및 비용 효율성을 유지하면서 벡터 검색 기능을 효과적으로 구현하려는 조직에 매우 중요합니다.

벡터 데이터베이스 솔루션에 대한 자세한 내용은 다음 섹션을 참조하세요.
+ [개별 벡터 데이터베이스 옵션](#individual-dbs)
+ [관리형 서비스 옵션](#managed-db)
+ [올바른 벡터 데이터베이스 선택](#choosing-database)

## 개별 벡터 데이터베이스 옵션
<a name="individual-dbs"></a>

의 개별 벡터 데이터베이스 옵션에는 [Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/what-is-kendra.html), [Amazon OpenSearch Service](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/what-is.html), pgvector를 사용하는 [Amazon RDS for PostgreSQL](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/CHAP_PostgreSQL.html), [Amazon MemoryDB](https://docs.aws.amazon.com/memorydb/latest/devguide/what-is-memorydb.html), [Amazon DocumentDB](https://docs.aws.amazon.com/documentdb/latest/developerguide/what-is.html), [Amazon Neptune Analytics](https://docs.aws.amazon.com/neptune-analytics/latest/userguide/what-is-neptune-analytics.html) 및 [Amazon S3 Vector](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors.html)가 AWS 포함됩니다. (오픈 소스 확장인 pgvector는 ML 생성 벡터 임베딩을 저장하고 검색할 수 있는 기능을 추가합니다.) 이러한 솔루션은 벡터 검색에 대한 다양한 접근 방식을 제공하므로 조직은 기존 인프라, 기술 요구 사항 및 특정 [사용 사례를](use-cases.md) 기반으로 선택할 수 있습니다.

### Amazon Kendra
<a name="kendra"></a>

Amazon Kendra는 자연어 처리 및 고급 기계 학습 알고리즘을 사용하여 데이터의 검색 질문에 대한 특정 답변을 반환하는 엔터프라이즈급 지능형 검색 서비스입니다. Amazon Kendra는 검색 기능의 구현을 간소화하여 생성형 AI 애플리케이션을 위한 효과적인 백엔드 솔루션입니다.

Amazon Kendra의 기타 주요 기능은 다음과 같습니다.
+ [40개 이상의 데이터 소스](https://aws.amazon.com/kendra/connectors/)에 대한 기본 연결
+ 기본 제공 데이터 준비 기능
+ 심층적인 기술 전문 지식이 필요하지 않은 빠른 설정

Amazon Kendra의 이점은 다음과 같습니다.
+ 자동 데이터 처리(청킹, 수집, 검색)
+ 강력한 사용자 지정 옵션:
  + [패싯 검색](https://docs.aws.amazon.com/kendra/latest/dg/filtering.html)
  + [검색 분석](https://docs.aws.amazon.com/kendra/latest/dg/search-analytics.html)
  + [검색 관련성 조정](https://docs.aws.amazon.com/kendra/latest/dg/tuning.html)
+ 를 통한 간단한 프로그래밍 방식 액세스 [AWS SDK for Python (Boto3)](https://docs.aws.amazon.com/kendra/latest/dg/gs-python.html)

자세한 내용은 [Amazon Kendra 설명서의 Amazon Kendra의 이점을](https://docs.aws.amazon.com/kendra/latest/dg/what-is-kendra.html#what-is-benefits) 참조하세요.

### Amazon OpenSearch Service
<a name="opensearch-service"></a>

Amazon OpenSearch Service는에서 OpenSearch Service 클러스터를 배포, 운영 및 확장하는 데 도움이 되는 관리형 서비스입니다 AWS 클라우드.

OpenSearch Service의 핵심 기능은 다음과 같습니다.
+ 오픈 소스 검색 및 분석 엔진
+ 분산 아키텍처
+ 실시간 데이터 처리

OpenSearch Service 사용의 몇 가지 이점은 다음과 같습니다.
+ 수평 확장성
+ RESTful API 지원
+ 정형 및 비정형 데이터 처리
+ 실시간 데이터 분석
+ 다양한 배포 크기에 적합

자세한 내용은 [ OpenSearch Service 설명서의 Amazon](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/what-is.html#what-is-features) OpenSearch Service 기능을 참조하세요.

### pgvector를 사용하는 Amazon RDS for PostgreSQL
<a name="rds"></a>

[pgvector](https://github.com/pgvector/pgvector)를 사용하는 Amazon RDS for PostgreSQL은 AWS 관리형 관계형 데이터베이스 서비스를 PostgreSQL의 벡터 처리 확장과 결합합니다. 이 조합을 통해 조직은 Amazon RDS를 유지하면서 고차원 벡터를 저장하고 쿼리할 수 있습니다. 이 솔루션은 데이터베이스 인프라 관리 오버헤드 없이 실시간 벡터 작업이 필요한 생성형 AI 애플리케이션에 특히 적합합니다.

pgvector를 사용하는 Amazon RDS for PostgreSQL의 주요 이점은 다음과 같습니다.
+ 높은 가용성
+ 자동 장애조치(failover)
+ 비용 효율성(pay-per-use)
+ 기본 제공 모니터링
+ 실시간 벡터 데이터 통합

자세한 내용은 [Amazon RDS 설명서의 Amazon RDS의 이점을](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/Welcome.html) 참조하세요.

### Amazon DocumentDB
<a name="documentdb"></a>

Amazon DocumentDB(MongoDB 호환)는 버전 5.0 이상에서 기본 벡터 검색 기능을 제공하는 문서 데이터베이스입니다. JSON 기반 문서 스토리지의 유연성과 벡터 검색을 결합하여 계층적 탐색 가능 소규모 세계(HNSW) 및 반전 파일 플랫(IVFFlat) 인덱싱 방법을 모두 지원합니다.

Amazon DocumentDB의 핵심 기능은 다음과 같습니다.
+ 최대 2,000개의 차원(인덱싱 없이 최대 16,000개의 차원)에 벡터 저장 및 인덱싱
+ 벡터 유사성 검색을 위한 밀리초 응답 시간
+ 유클리드, 코사인 및 점 제품 거리 지표 지원
+ 기존 MongoDB 호환 애플리케이션과의 원활한 통합

다음과 같은 상황에서 Amazon DocumentDB를 사용합니다.
+ 이미 MongoDB APIs 사용하고 벡터 검색 기능이 필요한 애플리케이션의 경우
+ 의미 체계 검색과 결합된 유연한 문서 데이터 구조가 필요한 사용 사례의 경우
+ 기존 문서 쿼리와 벡터 유사성 검색이 모두 필요한 시나리오의 경우
+ 제품 추천, 개인 맞춤, 채팅 도우미 및 사기 탐지를 제공하는 애플리케이션의 경우

자세한 내용은 [ Amazon DocumentDB 설명서의 Amazon DocumentDB에 대한 벡터 검색을](https://docs.aws.amazon.com/documentdb/latest/developerguide/vector-search.html) 참조하세요. Amazon DocumentDB 

### Amazon MemoryDB
<a name="memorydb"></a>

Amazon MemoryDB는 널리 사용되는 벡터 데이터베이스 중에서 가장 빠른 벡터 검색 성능을 제공하는 Redis 호환 인 메모리 데이터베이스입니다 AWS. 다중 가용 영역 내구성과 함께 밀리초 미만의 쿼리 지연 시간을 제공합니다.

MemoryDB의 핵심 기능은 다음과 같습니다.
+ 애플리케이션 데이터와 수백만 개의 벡터를 단일 데이터베이스에 저장
+ 한 자릿수 밀리초 쿼리 및 업데이트 응답 시간
+ 에서 가장 빠른 성능으로 가장 높은 재현율 AWS
+ 벡터당 최대 32,768개 차원 지원
+ 실시간 의미 체계 검색 및 캐싱 기능

다음과 같은 상황에서 MemoryDB를 사용합니다.
+ 지연 시간이 매우 짧은(10ms 미만) 실시간 애플리케이션의 경우
+ 하루에 수백만 개의 요청이 있는 처리량이 많은 워크로드의 경우
+ 실시간 권장 엔진, 의미 체계 캐싱, 이상 탐지와 같은 사용 사례의 경우
+ 인 메모리 데이터 스토어와 벡터 검색 기능이 모두 필요한 애플리케이션의 경우

자세한 내용은 MemoryDB 설명서의 [벡터 검색을](https://docs.aws.amazon.com/memorydb/latest/devguide/vector-search.html) 참조하세요.

### Amazon Neptune Analytics
<a name="neptune"></a>

Amazon Neptune Analytics는 네이티브 벡터 검색 기능을 제공하는 그래프 분석 엔진으로, 그래프 검색 증강 생성(GraphRAG) 사용 사례에 적합합니다. 벡터 유사성 검색을 그래프 순회 및 알고리즘과 결합합니다.

Neptune Analytics의 핵심 기능은 다음과 같습니다.
+ 몇 초 안에 수십억 개의 관계 분석
+ 벡터 검색과 그래프 알고리즘 결합(경로 조사 결과, 커뮤니티 탐지, 중심성)
+ 토폴로지 지식을 갖춘 GraphRAG 애플리케이션 지원
+ 기존 그래프 분석 솔루션보다 최대 80배 빠름
+ 완전 관리형 GraphRAG를 위해 Amazon Bedrock과 통합

다음과 같은 상황에서 Neptune Analytics를 사용합니다.
+ 벡터 임베딩이 포함된 지식 그래프가 필요한 GraphRAG 애플리케이션의 경우
+ 벡터 유사성과 함께 복잡한 관계를 통과해야 하는 사용 사례의 경우
+ 관계 컨텍스트를 사용하여 설명 가능한 AI 응답이 필요한 애플리케이션의 경우
+ 고객 360 보기, 사기 탐지 네트워크, 지식 검색과 같은 시나리오의 경우

자세한 내용은 [Amazon Neptune Analytics 설명서를](https://docs.aws.amazon.com/neptune-analytics/latest/userguide/what-is-neptune-analytics.html) 참조하세요.

### Amazon S3 Vectors
<a name="s3-vectors"></a>

Amazon S3 Vectors는 네이티브 벡터 스토리지 및 쿼리 기능을 AWS 갖춘의 첫 번째 클라우드 객체 스토어입니다. 대규모 규모가 필요한 AI 애플리케이션을 위해 특별히 구축되고 비용 최적화된 벡터 스토리지를 제공합니다.

Amazon S3 벡터의 핵심 기능은 다음과 같습니다.
+ 벡터 버킷당 최대 10,000개의 인덱스를 지원하는 인덱스당 최대 20억 개의 벡터에 대한 스토리지
+ 장기 스토리지 및 빈번하지 않은 액세스 패턴에 최적화된 Sub-100 쿼리 지연 시간
+ 특수 벡터 데이터베이스에 비해 벡터 작업에 대해 최대 90% 비용 절감
+ 자동 조정 및 99.999999999%(11 9s) 내구성을 갖춘 서버리스 아키텍처

다음과 같은 상황에서 Amazon S3 벡터를 사용합니다.
+ 최소 비용으로 수십억 개의 벡터를 저장해야 하는 애플리케이션의 경우
+ 10ms 미만이 아닌 1초 미만의 쿼리 지연 시간(100ms 이상)을 허용하는 워크로드의 경우
+ 장기 벡터 보존 및 아카이브 사용 사례의 경우
+ 검색 패턴이 빈번하지 않은 RAG 애플리케이션의 경우
+ 지연 시간이 매우 짧은 것보다 스토리지 경제성을 우선시하는 조직의 경우

Amazon S3 Vectors는 기본적으로 Amazon Bedrock 지식 기반과 통합되며 Amazon OpenSearch Service의 계층형 아키텍처에서 잘 작동합니다. 콜드 스토리지에는 Amazon S3 벡터를 사용하고 핫 쿼리에는 OpenSearch Service를 사용할 수 있습니다.

자세한 내용은 Amazon [ S3 설명서의 S3 벡터 및 벡터 버킷 작업을 참조하세요](https://docs.aws.amazon.com/AmazonS3/latest/userguide/s3-vectors.html). Amazon S3 

## 관리형 서비스 옵션
<a name="managed-db"></a>

Amazon Bedrock 지식 기반은 벡터 데이터베이스 구현에 대한 AWS 완전관리형 접근 방식을 나타냅니다. 이 서비스의 스토리지 옵션 유연성은 자동화된 관리 기능과 결합되어 복잡한 인프라를 관리하지 않고 RAG를 구현하려는 조직에 특히 유용합니다.

Amazon Bedrock 지식 기반을 사용하면 RAG를 사용하여 파운데이션 모델을 개선하는 지식 기반을 생성, 유지 관리 및 쿼리할 수 있습니다. 이 서비스는 전체 데이터 수집, 벡터화 및 검색 파이프라인을 관리하여 RAG 구현의 복잡한 프로세스를 간소화합니다.

Amazon Bedrock 지식 기반의 주요 이점은 다음과 같습니다.
+ 간소화된 데이터 처리
  + 자동 데이터 수집 및 청킹
  + 여러 파일 형식에서 기본 제공 텍스트 추출
  + 관리형 벡터 임베딩 생성
  + 자동 메타데이터 추출 및 인덱싱
+ 간소화된 RAG 구현
  + 미리 구성된 검색 전략
  + 자동 컨텍스트 창 최적화
  + 기본 제공 관련성 튜닝
  + 시맨틱 검색 기능 즉시 사용 가능
+ 보안 및 거버넌스
  + 통합 AWS Identity and Access Management (IAM) 제어
  + 저장 및 전송 중 데이터 암호화
  + VPC 지원
  + 를 사용한 감사 로깅 AWS CloudTrail

Amazon Bedrock 지식 기반은 다음을 포함한 여러 [벡터 스토어 옵션을](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html) 지원합니다.
+ pgvector를 사용하는 Amazon Aurora PostgreSQL 
+ Amazon Neptune Analytics
+ Amazon EMR Serverless
+ Amazon S3 Vectors
+ Pinecone
+ Redis 엔터프라이즈 클라우드

이 관리형 서비스는 자동 데이터 수집, 벡터화 및 검색을 처리합니다. 이렇게 하면 RAG 구현이 간소화됩니다.

지원되는 각 벡터 저장소에 대한 자세한 내용은 [Amazon Bedrock 지식 기반 설명서를 참조하세요](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html).

## 올바른 벡터 데이터베이스 선택
<a name="choosing-database"></a>

다음과 같은 주요 결정 요인을 기반으로 벡터 데이터베이스를 선택합니다.
+ **벡터 검색과 함께 MongoDB 호환 문서 데이터베이스가 필요한 경우** - Amazon DocumentDB를 선택합니다. 이는 애플리케이션이 MongoDB APIs 사용하고 별도의 벡터 인프라를 관리하지 않고 의미 체계 검색 기능을 추가하려는 경우에 적합합니다.
+ **실시간 애플리케이션에 매우 짧은 지연 시간이 필요한 경우** Amazon MemoryDB를 선택합니다. 이렇게 하면 응답 시간이 밀리초 AWS 미만인에서 가장 빠른 벡터 검색 성능이 제공됩니다. 실시간 추천 엔진 및 고처리량 애플리케이션에 적합합니다.
+ **벡터 검색으로 그래프 기반 지식 표현이 필요한 경우** - Amazon Neptune Analytics를 선택합니다. 이는 복잡한 관계를 통과하고 벡터 검색과 함께 그래프 기반 쿼리를 수행해야 하는 GraphRAG 애플리케이션에 가장 적합하며 설명 가능한 AI 응답을 제공합니다.
+ **관계형 쿼리를 벡터 검색과 결합해야 하는 경우** - pgvector를 사용하여 Amazon Aurora PostgreSQL을 선택합니다. 이 옵션은 애플리케이션에 동일한 데이터베이스 내에서 기존 SQL 작업과 벡터 유사성 검색이 모두 필요한 경우에 적합합니다.
+ **지연 시간이 10ms 미만인 처리량이 많은 쿼리가 필요한 경우** Amazon OpenSearch Service를 선택합니다. 고빈도 쿼리 및 실시간 애플리케이션을 처리하는 데 뛰어나며 최근 GPU 가속화 개선 사항이 포함되어 있습니다.
+ 수십**억 개의 벡터를 비용 효율적으로 저장해야 하는 경우** - Amazon S3 벡터를 선택합니다. 이 옵션은 최대 90%의 비용 절감을 제공하며 100ms 미만의 지연 시간을 허용할 수 있는 검색 패턴(쿼리 간 몇 분에서 몇 시간)이 자주 발생하지 않는 애플리케이션에 적합합니다.
+ **벡터 검색과 함께 전체 텍스트 검색이 필요한 경우** - Amazon OpenSearch Service를 선택합니다. 이 옵션은 강력한 전체 텍스트 검색 기능을 단일 플랫폼에서 벡터 검색과 결합합니다.