View a markdown version of this page

向量資料庫比較 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

向量資料庫比較

AWS 提供實作向量搜尋功能的多種方法,從個別向量資料庫到 Amazon Bedrock 知識庫,這是全受管服務。評估這些選項時,組織必須考慮各種層面,包括架構、可擴展性、整合功能、效能特性和安全功能。

個別向量資料庫

下表提供數個 AWS 個別向量資料庫解決方案的主要功能概觀,著重於其架構、擴展功能、資料來源整合和效能特性。

功能

Amazon Kendra

Amazon OpenSearch Service

Amazon RDS for PostgreSQLwith pgvector

Amazon DocumentDB

Amazon MemoryDB

Amazon Neptune Analytics

Amazon S3 Vectors

主要使用案例

企業搜尋和 RAG

分散式搜尋和分析

支援向量的關係式資料庫

具有向量搜尋的文件資料庫

即時記憶體內向量搜尋

使用向量搜尋進行圖形分析

成本最佳化向量儲存

Architecture

全受管

分散式叢集

關聯式資料庫

文件導向

記憶體資料庫

圖形分析引擎

無伺服器物件儲存

資料模型

以文件為基礎的

JSON 文件

關聯式資料表

JSON 文件

使用 JSON 的鍵值

屬性圖表

物件儲存體

向量維度

自動管理

高達 16,000

可設定

最多 2,000 個 (索引);16,000 個 (未索引)

高達 32,768

可設定

高達 4,096

索引方法

自動

HNSW、IVF

HNSW、IVFFlat

HNSW、IVFFlat

HNSW

原生圖形和向量

自動

距離指標

自動

Cosine、Euclidean、點產品

Cosine、Euclidean、內部產品

Cosine、Euclidean、點產品

Cosine、Euclidean、內部產品

Cosine、Euclidean

Cosine、Euclidean

查詢延遲

次秒

Sub-10 毫秒 (GPU 加速)

10-100 毫秒

毫秒

亞毫秒

次秒

Sub-100 毫秒

擴展模型

自動

水平 (新增節點)

垂直和僅供讀取複本

水平 (新增執行個體)

垂直和複本

自動

自動 (無伺服器)

向量上限

受管

十億元 (取決於叢集)

百萬 (執行個體相依)

每個集合的百萬

每個資料庫的百萬

十億

每個索引 20 億;每個儲存貯體 10,000 個索引

輸送量

極高 (數千個 QPS)

非常高 (每天數百萬個請求)

中 (針對不常查詢進行最佳化)

資料耐用性

99.999999999% (11 9s)

可使用複本設定

99.99% (異地同步備份)

99.99% (異地同步備份)

99.99% (異地同步備份)

99.99%

99.999999999% (11 9s)

一致性模型

最終

最終 (可設定)

強 (ACID)

最終

強大

強大

強大

其他功能

40 個或更多資料連接器,NLP

全文搜尋、分析、儀表板

SQL 查詢、ACID 交易

MongoDB API 相容性

Redis API 相容性、快取

圖形演算法、周遊

Amazon S3 整合、生命週期政策

定價方式

按查詢和儲存付費

執行個體時數和儲存

執行個體時數和儲存

執行個體時數和儲存

執行個體時數和儲存

容量單位和儲存體

儲存、查詢和資料傳輸

成本最佳化

以用量為基礎的

預留執行個體、自動擴展

預留執行個體,Aurora Serverless

預留執行個體

預留執行個體

自動調整規模

與專用DBs相比,節省高達 90%

最適合

以最少的設定進行企業搜尋

高輸送量、低延遲查詢

混合 SQL 和向量工作負載

需要向量的 MongoDB 相容應用程式

即時、極低延遲的應用程式

GraphRAG 和知識圖表

長期、經濟實惠的儲存體

理想的查詢模式

頻繁的企業搜尋

高頻率即時查詢

混合 SQL 和向量查詢

使用語意搜尋記錄查詢

每天數百萬個請求

使用向量搜尋繪製周遊圖形

不常查詢 (分鐘到小時)

設定複雜性

低 (完全受管)

中 (叢集組態)

中 (延伸設定)

中 (叢集組態)

中 (叢集組態)

低 (完全受管)

低 (無伺服器)

所需的團隊專業知識

極小

OpenSearch 或 Elasticsearch

PostgreSQL、SQL

MongoDB

Redis

圖形資料庫

Amazon S3,基本向量概念

受管服務 – Amazon Bedrock 知識庫

Amazon Bedrock 知識庫提供具有多個向量儲存選項的全受管解決方案。下表會比較這些儲存選項。

功能

Aurora PostgreSQLwith pgvector

Neptune 分析

OpenSearch Service Serverless

Amazon S3 向量

Pinecone

RedisEnterprise 雲端

主要使用案例

具有向量 RAG 的關係式資料庫

GraphRAG 的圖形型向量搜尋

知識管理 RAG

成本最佳化向量 RAG

高效能向量搜尋

記憶體內向量搜尋

Architecture

全受管關聯式

全受管圖形分析

全受管無伺服器

無伺服器物件儲存

全受管混合雲端

完全受管的記憶體內

資料模型

關聯式資料表

屬性圖表

JSON 文件

物件儲存體

專用向量

具有向量的鍵值

向量儲存

透過 pgvector 延伸模組

原生圖形向量

透過 OpenSearch 引擎

原生 Amazon S3 向量儲存

原生向量資料庫

記憶體內向量

Amazon Bedrock 整合

原生

原生

原生

原生

原生

原生

自動擷取

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

自動向量化

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

是 (透過 Amazon Bedrock)

擴展

自動擴展 (Aurora Serverless)

自動圖形擴展

自動無伺服器

自動 (十億個向量)

自動擴展 Pod

自動擴展叢集

查詢效能

關聯式或向量高

圖形向量高

中等 (100 毫秒或更多延遲)

非常高

非常高

向量上限

百萬 (執行個體相依)

十億

十億

每個索引 20 億個

十億

百萬 (記憶體相依)

其他功能

SQL 查詢、ACID 交易

圖形演算法、周遊

全文搜尋、分析

Amazon S3 生命週期、分層

中繼資料篩選、命名空間

Redis 資料結構、快取

成本最佳化

中等 (Aurora Serverless)

中等 (容量單位)

高 (無伺服器、pay-per-use)

非常高 (節省高達 90%)

中等 (以 Pod 為基礎的定價)

低 (記憶體內溢價)

最適合

混合 SQL/向量工作負載

連線的知識圖表

具有向量搜尋的全文

長期、不常存取的向量

大規模即時向量搜尋

超低延遲需求

理想的查詢模式

混合 SQL 和向量查詢

使用向量繪製周遊

經常使用 分析進行搜尋

不常擷取 (分鐘到小時)

高頻率即時查詢

每秒數百萬個請求

使用 Amazon Bedrock 設定

簡單 (由 Amazon Bedrock 管理)

簡單 (由 Amazon Bedrock 管理)

簡單 (由 Amazon Bedrock 管理)

簡單 (由 Amazon Bedrock 管理)

簡單 (由 Amazon Bedrock 管理)

簡單 (由 Amazon Bedrock 管理)

資料落地

AWS 區域

AWS 區域

AWS 區域

AWS 區域

多雲端 (AWS 及其他)

多雲端 (AWS 及其他)

定價方式

執行個體時數和儲存體

容量單位和儲存體

運算和儲存 (無伺服器)

儲存、查詢和傳輸

Pod 時數和儲存

節點時數和儲存

在個別選項和受管選項之間進行選擇

考量事項

選擇個別向量資料庫

選擇 Amazon Bedrock 知識庫 (受管)

RAG 實作

您想要完全控制 RAG 管道

您想要設定最少的全受管 RAG

自訂

您需要自訂擷取邏輯和預先處理

標準 RAG 模式符合您的需求

現有基礎設施

您已部署資料庫

您開始全新或想要簡化的管理

團隊專業知識

您的團隊具備資料庫管理專業知識

您偏好專注於應用程式邏輯,而不是基礎設施

整合複雜性

您需要與現有系統深度整合

您想要快速整合 Amazon Bedrock 模型

營運開銷

您可以管理資料庫操作

AWS 您想要處理 操作

成本結構

您偏好直接資料庫定價

您偏好統一的 Amazon Bedrock 定價

上市時間

您有時間進行自訂實作

您需要快速部署