本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
向量資料庫比較
AWS 提供實作向量搜尋功能的多種方法,從個別向量資料庫到 Amazon Bedrock 知識庫,這是全受管服務。評估這些選項時,組織必須考慮各種層面,包括架構、可擴展性、整合功能、效能特性和安全功能。
個別向量資料庫
下表提供數個 AWS 個別向量資料庫解決方案的主要功能概觀,著重於其架構、擴展功能、資料來源整合和效能特性。
功能 |
Amazon Kendra |
Amazon OpenSearch Service |
Amazon RDS for PostgreSQLwith pgvector |
Amazon DocumentDB |
Amazon MemoryDB |
Amazon Neptune Analytics |
Amazon S3 Vectors |
|---|---|---|---|---|---|---|---|
主要使用案例 |
企業搜尋和 RAG |
分散式搜尋和分析 |
支援向量的關係式資料庫 |
具有向量搜尋的文件資料庫 |
即時記憶體內向量搜尋 |
使用向量搜尋進行圖形分析 |
成本最佳化向量儲存 |
Architecture |
全受管 |
分散式叢集 |
關聯式資料庫 |
文件導向 |
記憶體資料庫 |
圖形分析引擎 |
無伺服器物件儲存 |
資料模型 |
以文件為基礎的 |
JSON 文件 |
關聯式資料表 |
JSON 文件 |
使用 JSON 的鍵值 |
屬性圖表 |
物件儲存體 |
向量維度 |
自動管理 |
高達 16,000 |
可設定 |
最多 2,000 個 (索引);16,000 個 (未索引) |
高達 32,768 |
可設定 |
高達 4,096 |
索引方法 |
自動 |
HNSW、IVF |
HNSW、IVFFlat |
HNSW、IVFFlat |
HNSW |
原生圖形和向量 |
自動 |
距離指標 |
自動 |
Cosine、Euclidean、點產品 |
Cosine、Euclidean、內部產品 |
Cosine、Euclidean、點產品 |
Cosine、Euclidean、內部產品 |
Cosine、Euclidean |
Cosine、Euclidean |
查詢延遲 |
次秒 |
Sub-10 毫秒 (GPU 加速) |
10-100 毫秒 |
毫秒 |
亞毫秒 |
次秒 |
Sub-100 毫秒 |
擴展模型 |
自動 |
水平 (新增節點) |
垂直和僅供讀取複本 |
水平 (新增執行個體) |
垂直和複本 |
自動 |
自動 (無伺服器) |
向量上限 |
受管 |
十億元 (取決於叢集) |
百萬 (執行個體相依) |
每個集合的百萬 |
每個資料庫的百萬 |
十億 |
每個索引 20 億;每個儲存貯體 10,000 個索引 |
輸送量 |
高 |
極高 (數千個 QPS) |
中 |
高 |
非常高 (每天數百萬個請求) |
高 |
中 (針對不常查詢進行最佳化) |
資料耐用性 |
99.999999999% (11 9s) |
可使用複本設定 |
99.99% (異地同步備份) |
99.99% (異地同步備份) |
99.99% (異地同步備份) |
99.99% |
99.999999999% (11 9s) |
一致性模型 |
最終 |
最終 (可設定) |
強 (ACID) |
最終 |
強大 |
強大 |
強大 |
其他功能 |
40 個或更多資料連接器,NLP |
全文搜尋、分析、儀表板 |
SQL 查詢、ACID 交易 |
MongoDB API 相容性 |
Redis API 相容性、快取 |
圖形演算法、周遊 |
Amazon S3 整合、生命週期政策 |
定價方式 |
按查詢和儲存付費 |
執行個體時數和儲存 |
執行個體時數和儲存 |
執行個體時數和儲存 |
執行個體時數和儲存 |
容量單位和儲存體 |
儲存、查詢和資料傳輸 |
成本最佳化 |
以用量為基礎的 |
預留執行個體、自動擴展 |
預留執行個體,Aurora Serverless |
預留執行個體 |
預留執行個體 |
自動調整規模 |
與專用DBs相比,節省高達 90% |
最適合 |
以最少的設定進行企業搜尋 |
高輸送量、低延遲查詢 |
混合 SQL 和向量工作負載 |
需要向量的 MongoDB 相容應用程式 |
即時、極低延遲的應用程式 |
GraphRAG 和知識圖表 |
長期、經濟實惠的儲存體 |
理想的查詢模式 |
頻繁的企業搜尋 |
高頻率即時查詢 |
混合 SQL 和向量查詢 |
使用語意搜尋記錄查詢 |
每天數百萬個請求 |
使用向量搜尋繪製周遊圖形 |
不常查詢 (分鐘到小時) |
設定複雜性 |
低 (完全受管) |
中 (叢集組態) |
中 (延伸設定) |
中 (叢集組態) |
中 (叢集組態) |
低 (完全受管) |
低 (無伺服器) |
所需的團隊專業知識 |
極小 |
OpenSearch 或 Elasticsearch |
PostgreSQL、SQL |
MongoDB |
Redis |
圖形資料庫 |
Amazon S3,基本向量概念 |
受管服務 – Amazon Bedrock 知識庫
Amazon Bedrock 知識庫提供具有多個向量儲存選項的全受管解決方案。下表會比較這些儲存選項。
功能 |
Aurora PostgreSQLwith pgvector |
Neptune 分析 |
OpenSearch Service Serverless |
Amazon S3 向量 |
Pinecone |
RedisEnterprise 雲端 |
|---|---|---|---|---|---|---|
主要使用案例 |
具有向量 RAG 的關係式資料庫 |
GraphRAG 的圖形型向量搜尋 |
知識管理 RAG |
成本最佳化向量 RAG |
高效能向量搜尋 |
記憶體內向量搜尋 |
Architecture |
全受管關聯式 |
全受管圖形分析 |
全受管無伺服器 |
無伺服器物件儲存 |
全受管混合雲端 |
完全受管的記憶體內 |
資料模型 |
關聯式資料表 |
屬性圖表 |
JSON 文件 |
物件儲存體 |
專用向量 |
具有向量的鍵值 |
向量儲存 |
透過 pgvector 延伸模組 |
原生圖形向量 |
透過 OpenSearch 引擎 |
原生 Amazon S3 向量儲存 |
原生向量資料庫 |
記憶體內向量 |
Amazon Bedrock 整合 |
原生 |
原生 |
原生 |
原生 |
原生 |
原生 |
自動擷取 |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
自動向量化 |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
是 (透過 Amazon Bedrock) |
擴展 |
自動擴展 (Aurora Serverless) |
自動圖形擴展 |
自動無伺服器 |
自動 (十億個向量) |
自動擴展 Pod |
自動擴展叢集 |
查詢效能 |
關聯式或向量高 |
圖形向量高 |
高 |
中等 (100 毫秒或更多延遲) |
非常高 |
非常高 |
向量上限 |
百萬 (執行個體相依) |
十億 |
十億 |
每個索引 20 億個 |
十億 |
百萬 (記憶體相依) |
其他功能 |
SQL 查詢、ACID 交易 |
圖形演算法、周遊 |
全文搜尋、分析 |
Amazon S3 生命週期、分層 |
中繼資料篩選、命名空間 |
Redis 資料結構、快取 |
成本最佳化 |
中等 (Aurora Serverless) |
中等 (容量單位) |
高 (無伺服器、pay-per-use) |
非常高 (節省高達 90%) |
中等 (以 Pod 為基礎的定價) |
低 (記憶體內溢價) |
最適合 |
混合 SQL/向量工作負載 |
連線的知識圖表 |
具有向量搜尋的全文 |
長期、不常存取的向量 |
大規模即時向量搜尋 |
超低延遲需求 |
理想的查詢模式 |
混合 SQL 和向量查詢 |
使用向量繪製周遊 |
經常使用 分析進行搜尋 |
不常擷取 (分鐘到小時) |
高頻率即時查詢 |
每秒數百萬個請求 |
使用 Amazon Bedrock 設定 |
簡單 (由 Amazon Bedrock 管理) |
簡單 (由 Amazon Bedrock 管理) |
簡單 (由 Amazon Bedrock 管理) |
簡單 (由 Amazon Bedrock 管理) |
簡單 (由 Amazon Bedrock 管理) |
簡單 (由 Amazon Bedrock 管理) |
資料落地 |
AWS 區域 |
AWS 區域 |
AWS 區域 |
AWS 區域 |
多雲端 (AWS 及其他) |
多雲端 (AWS 及其他) |
定價方式 |
執行個體時數和儲存體 |
容量單位和儲存體 |
運算和儲存 (無伺服器) |
儲存、查詢和傳輸 |
Pod 時數和儲存 |
節點時數和儲存 |
在個別選項和受管選項之間進行選擇
考量事項 |
選擇個別向量資料庫 |
選擇 Amazon Bedrock 知識庫 (受管) |
|---|---|---|
RAG 實作 |
您想要完全控制 RAG 管道 |
您想要設定最少的全受管 RAG |
自訂 |
您需要自訂擷取邏輯和預先處理 |
標準 RAG 模式符合您的需求 |
現有基礎設施 |
您已部署資料庫 |
您開始全新或想要簡化的管理 |
團隊專業知識 |
您的團隊具備資料庫管理專業知識 |
您偏好專注於應用程式邏輯,而不是基礎設施 |
整合複雜性 |
您需要與現有系統深度整合 |
您想要快速整合 Amazon Bedrock 模型 |
營運開銷 |
您可以管理資料庫操作 |
AWS 您想要處理 操作 |
成本結構 |
您偏好直接資料庫定價 |
您偏好統一的 Amazon Bedrock 定價 |
上市時間 |
您有時間進行自訂實作 |
您需要快速部署 |