

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 向量資料庫比較
<a name="vector-db-comparison"></a>

AWS 提供實作向量搜尋功能的多種方法，從個別向量資料庫到 Amazon Bedrock 知識庫，這是全受管服務。評估這些選項時，組織必須考慮各種層面，包括架構、可擴展性、整合功能、效能特性和安全功能。

## 個別向量資料庫
<a name="individual-vector-databases"></a>

下表提供數個 AWS 個別向量資料庫解決方案的主要功能概觀，著重於其架構、擴展功能、資料來源整合和效能特性。


| 
| 
| **功能** | **Amazon Kendra** | **Amazon OpenSearch Service** | **Amazon RDS for PostgreSQLwith pgvector** | **Amazon DocumentDB** | **Amazon MemoryDB** | **Amazon Neptune Analytics** | **Amazon S3 Vectors** | 
| --- |--- |--- |--- |--- |--- |--- |--- |
| 主要使用案例 | 企業搜尋和 RAG | 分散式搜尋和分析 | 支援向量的關係式資料庫 | 具有向量搜尋的文件資料庫 | 即時記憶體內向量搜尋 | 使用向量搜尋進行圖形分析 | 成本最佳化向量儲存 | 
| Architecture | 全受管 | 分散式叢集 | 關聯式資料庫 | 文件導向 | 記憶體資料庫 | 圖形分析引擎 | 無伺服器物件儲存 | 
| 資料模型 | 以文件為基礎的 | JSON 文件 | 關聯式資料表 | JSON 文件 | 使用 JSON 的鍵值 | 屬性圖表 | 物件儲存體 | 
| 向量維度 | 自動管理 | 高達 16，000 | 可設定 | 最多 2，000 個 （索引）；16，000 個 （未索引） | 高達 32，768 | 可設定 | 高達 4，096 | 
| 索引方法 | 自動 | HNSW、IVF | HNSW、IVFFlat | HNSW、IVFFlat | HNSW | 原生圖形和向量 | 自動 | 
| 距離指標 | 自動 | Cosine、Euclidean、點產品 | Cosine、Euclidean、內部產品 | Cosine、Euclidean、點產品 | Cosine、Euclidean、內部產品 | Cosine、Euclidean | Cosine、Euclidean | 
| 查詢延遲 | 次秒 | Sub-10 毫秒 (GPU 加速） | 10-100 毫秒 | 毫秒 | 亞毫秒 | 次秒 | Sub-100 毫秒 | 
| 擴展模型 | 自動 | 水平 （新增節點） | 垂直和僅供讀取複本 | 水平 （新增執行個體） | 垂直和複本 | 自動 | 自動 （無伺服器） | 
| 向量上限 | 受管 | 十億元 （取決於叢集） | 百萬 （執行個體相依） | 每個集合的百萬 | 每個資料庫的百萬 | 十億 | 每個索引 20 億；每個儲存貯體 10，000 個索引 | 
| 輸送量 | 高 | 極高 （數千個 QPS) | 中 | 高 | 非常高 （每天數百萬個請求） | 高 | 中 （針對不常查詢進行最佳化） | 
| 資料耐用性 | 99.999999999% (11 9s) | 可使用複本設定 | 99.99% （異地同步備份） | 99.99% （異地同步備份） | 99.99% （異地同步備份） | 99.99% | 99.999999999% (11 9s) | 
| 一致性模型 | 最終 | 最終 （可設定） | 強 (ACID) | 最終 | 強大 | 強大 | 強大 | 
| 其他功能 | 40 個或更多資料連接器，NLP | 全文搜尋、分析、儀表板 | SQL 查詢、ACID 交易 | MongoDB API 相容性 | Redis API 相容性、快取 | 圖形演算法、周遊 | Amazon S3 整合、生命週期政策 | 
| 定價方式 | 按查詢和儲存付費 | 執行個體時數和儲存 | 執行個體時數和儲存 | 執行個體時數和儲存 | 執行個體時數和儲存 | 容量單位和儲存體 | 儲存、查詢和資料傳輸 | 
| 成本最佳化 | 以用量為基礎的 | 預留執行個體、自動擴展 | 預留執行個體，Aurora Serverless | 預留執行個體 | 預留執行個體 | 自動調整規模 | 與專用DBs相比，節省高達 90% | 
| 最適合 | 以最少的設定進行企業搜尋 | 高輸送量、低延遲查詢 | 混合 SQL 和向量工作負載 | 需要向量的 MongoDB 相容應用程式 | 即時、極低延遲的應用程式 | GraphRAG 和知識圖表 | 長期、經濟實惠的儲存體 | 
| 理想的查詢模式 | 頻繁的企業搜尋 | 高頻率即時查詢 | 混合 SQL 和向量查詢 | 使用語意搜尋記錄查詢 | 每天數百萬個請求 | 使用向量搜尋繪製周遊圖形 | 不常查詢 （分鐘到小時） | 
| 設定複雜性 | 低 （完全受管） | 中 （叢集組態） | 中 （延伸設定） | 中 （叢集組態） | 中 （叢集組態） | 低 （完全受管） | 低 （無伺服器） | 
| 所需的團隊專業知識 | 極小 | OpenSearch 或 Elasticsearch | PostgreSQL、SQL | MongoDB | Redis | 圖形資料庫 | Amazon S3，基本向量概念 | 

## 受管服務 – Amazon Bedrock 知識庫
<a name="managed-service"></a>

Amazon Bedrock 知識庫提供具有多個向量儲存選項的全受管解決方案。下表會比較這些儲存選項。


| 
| 
| **功能** | **Aurora PostgreSQLwith pgvector** | **Neptune 分析** | **OpenSearch Service Serverless** | **Amazon S3 向量** | **Pinecone** | **RedisEnterprise 雲端** | 
| --- |--- |--- |--- |--- |--- |--- |
| 主要使用案例 | 具有向量 RAG 的關係式資料庫 | GraphRAG 的圖形型向量搜尋 | 知識管理 RAG | 成本最佳化向量 RAG | 高效能向量搜尋 | 記憶體內向量搜尋 | 
| Architecture | 全受管關聯式 | 全受管圖形分析 | 全受管無伺服器 | 無伺服器物件儲存 | 全受管混合雲端 | 完全受管的記憶體內 | 
| 資料模型 | 關聯式資料表 | 屬性圖表 | JSON 文件 | 物件儲存體 | 專用向量 | 具有向量的鍵值 | 
| 向量儲存 | 透過 pgvector 延伸模組 | 原生圖形向量 | 透過 OpenSearch 引擎 | 原生 Amazon S3 向量儲存 | 原生向量資料庫 | 記憶體內向量 | 
| Amazon Bedrock 整合 | 原生 | 原生 | 原生 | 原生 | 原生 | 原生 | 
| 自動擷取 | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 
| 自動向量化 | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 是 （透過 Amazon Bedrock) | 
| 擴展 | 自動擴展 (Aurora Serverless) | 自動圖形擴展 | 自動無伺服器 | 自動 （十億個向量） | 自動擴展 Pod | 自動擴展叢集 | 
| 查詢效能 | 關聯式或向量高 | 圖形向量高 | 高 | 中等 (100 毫秒或更多延遲） | 非常高 | 非常高 | 
| 向量上限 | 百萬 （執行個體相依） | 十億 | 十億 | 每個索引 20 億個 | 十億 | 百萬 （記憶體相依） | 
| 其他功能 | SQL 查詢、ACID 交易 | 圖形演算法、周遊 | 全文搜尋、分析 | Amazon S3 生命週期、分層 | 中繼資料篩選、命名空間 | Redis 資料結構、快取 | 
| 成本最佳化 | 中等 (Aurora Serverless) | 中等 （容量單位） | 高 （無伺服器、pay-per-use) | 非常高 （節省高達 90%) | 中等 （以 Pod 為基礎的定價） | 低 （記憶體內溢價） | 
| 最適合 | 混合 SQL/向量工作負載 | 連線的知識圖表 | 具有向量搜尋的全文 | 長期、不常存取的向量 | 大規模即時向量搜尋 | 超低延遲需求 | 
| 理想的查詢模式 | 混合 SQL 和向量查詢 | 使用向量繪製周遊 | 經常使用 分析進行搜尋 | 不常擷取 （分鐘到小時） | 高頻率即時查詢 | 每秒數百萬個請求 | 
| 使用 Amazon Bedrock 設定 | 簡單 （由 Amazon Bedrock 管理） | 簡單 （由 Amazon Bedrock 管理） | 簡單 （由 Amazon Bedrock 管理） | 簡單 （由 Amazon Bedrock 管理） | 簡單 （由 Amazon Bedrock 管理） | 簡單 （由 Amazon Bedrock 管理） | 
| 資料落地 | AWS 區域 | AWS 區域 | AWS 區域 | AWS 區域 | 多雲端 (AWS 及其他） | 多雲端 (AWS 及其他） | 
| 定價方式 | 執行個體時數和儲存體 | 容量單位和儲存體 | 運算和儲存 （無伺服器） | 儲存、查詢和傳輸 | Pod 時數和儲存 | 節點時數和儲存 | 

## 在個別選項和受管選項之間進行選擇
<a name="decision-matrix"></a>


| 
| 
| **考量事項** | **選擇個別向量資料庫** | **選擇 Amazon Bedrock 知識庫 （受管）** | 
| --- |--- |--- |
| RAG 實作 | 您想要完全控制 RAG 管道 | 您想要設定最少的全受管 RAG | 
| 自訂 | 您需要自訂擷取邏輯和預先處理 | 標準 RAG 模式符合您的需求 | 
| 現有基礎設施 | 您已部署資料庫 | 您開始全新或想要簡化的管理 | 
| 團隊專業知識 | 您的團隊具備資料庫管理專業知識 | 您偏好專注於應用程式邏輯，而不是基礎設施 | 
| 整合複雜性 | 您需要與現有系統深度整合 | 您想要快速整合 Amazon Bedrock 模型 | 
| 營運開銷 | 您可以管理資料庫操作 |  AWS 您想要處理 操作 | 
| 成本結構 | 您偏好直接資料庫定價 | 您偏好統一的 Amazon Bedrock 定價 | 
| 上市時間 | 您有時間進行自訂實作 | 您需要快速部署 | 