翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ベクトルデータベースの比較
AWS は、個々のベクトルデータベースからフルマネージドサービスである Amazon Bedrock ナレッジベースまで、ベクトル検索機能を実装するための複数のアプローチを提供します。これらのオプションを評価する際、組織はアーキテクチャ、スケーラビリティ、統合機能、パフォーマンス特性、セキュリティ機能など、さまざまな側面を考慮する必要があります。
個々のベクトルデータベース
次の表は、アーキテクチャ、スケーリング機能、データソース統合、パフォーマンス特性に焦点を当てた、個々の AWS ベクトルデータベースソリューションの主な機能の概要を示しています。
機能 |
Amazon Kendra |
Amazon OpenSearch Service |
pgvector を使用した Amazon RDS for PostgreSQLwith |
Amazon DocumentDB |
Amazon MemoryDB |
Amazon Neptune Analytics |
Amazon S3 Vectors |
|---|---|---|---|---|---|---|---|
主なユースケース |
エンタープライズ検索と RAG |
分散検索と分析 |
ベクトルをサポートするリレーショナル DB |
ベクトル検索を使用したドキュメント DB |
リアルタイムインメモリベクトル検索 |
ベクトル検索によるグラフ分析 |
コスト最適化ベクトルストレージ |
アーキテクチャ |
フルマネージド型 |
分散クラスター |
リレーショナルデータベース |
ドキュメント指向 |
インメモリデータベース |
グラフ分析エンジン |
サーバーレスオブジェクトストレージ |
データモデル |
ドキュメントベース |
JSON ドキュメント |
リレーショナルテーブル |
JSON ドキュメント |
JSON を使用したキーと値 |
プロパティグラフ |
オブジェクトストレージ |
ベクトルディメンション |
自動管理 |
最大 16,000 |
設定可能 |
最大 2,000 (インデックス付き)、16,000 (インデックスなし) |
最大 32,768 |
設定可能 |
最大 4,096 |
インデックス作成方法 |
自動 |
HNSW、IVF |
HNSW、IVFFlat |
HNSW、IVFFlat |
HNSW |
ネイティブグラフとベクトル |
自動 |
距離メトリクス |
自動 |
コサイン、ユークリッド、ドット製品 |
コサイン、ユークリッド、内部製品 |
コサイン、ユークリッド、ドット製品 |
コサイン、ユークリッド、内部製品 |
コサイン、ユークリッド語 |
コサイン、ユークリッド語 |
クエリレイテンシー |
1 秒未満 |
Sub-10 (GPU アクセラレーション) |
10~100 ミリ秒 |
ミリ秒 |
ミリ秒未満 |
1 秒未満 |
Sub-100 |
スケーリングモデル |
自動 |
水平 (ノードの追加) |
垂直レプリカとリードレプリカ |
水平 (インスタンスの追加) |
垂直およびレプリカ |
自動 |
自動 (サーバーレス) |
最大ベクトル |
マネージド |
数十億 (クラスター依存) |
百万 (インスタンス依存) |
コレクションあたりの数百万 |
データベースあたり 100 万 |
数十億 |
インデックスあたり 20 億、バケットあたり 10,000 インデックス |
スループット |
高 |
非常に高い (数千の QPS) |
中 |
高 |
非常に高い (1 日あたり数百万件のリクエスト) |
高 |
中 (低頻度クエリに最適化) |
データ耐久性 |
99.999999999% (11 9s) |
レプリカで設定可能 |
99.99% (マルチ AZ) |
99.99% (マルチ AZ) |
99.99% (マルチ AZ) |
99.99% |
99.999999999% (11 9s) |
整合性モデル |
結果 |
結果 (設定可能) |
強力 (ACID) |
結果 |
強力 |
強力 |
強力 |
その他の機能 |
40 個以上のデータコネクタ、NLP |
全文検索、分析、ダッシュボード |
SQL クエリ、ACID トランザクション |
MongoDB API の互換性 |
Redis API の互換性、キャッシュ |
グラフアルゴリズム、トラバーサル |
Amazon S3 統合、ライフサイクルポリシー |
料金モデル |
クエリとストレージあたりの支払い |
インスタンス時間とストレージ |
インスタンス時間とストレージ |
インスタンス時間とストレージ |
インスタンス時間とストレージ |
キャパシティーユニットとストレージ |
ストレージ、クエリ、データ転送 |
コスト最適化 |
使用状況ベース |
リザーブドインスタンス、自動スケーリング |
リザーブドインスタンス、Aurora Serverless |
リザーブドインスタンス |
リザーブドインスタンス |
Auto-scaling |
特殊な DBs節約 |
次の用途に適しています |
最小限のセットアップでエンタープライズ検索 |
高スループット、低レイテンシーのクエリ |
ハイブリッド SQL およびベクトルワークロード |
ベクトルを必要とする MongoDB 互換アプリケーション |
超低レイテンシーのリアルタイムアプリケーション |
GraphRAG グラフとナレッジグラフ |
長期で費用対効果の高いストレージ |
理想的なクエリパターン |
頻繁なエンタープライズ検索 |
高頻度リアルタイムクエリ |
SQL クエリとベクトルクエリの混在 |
セマンティック検索を使用したドキュメントクエリ |
1 日あたり数百万のリクエスト |
ベクトル検索を使用したグラフトラバーサル |
低頻度のクエリ (分~時間) |
セットアップの複雑さ |
低 (フルマネージド) |
中 (クラスター設定) |
中 (拡張設定) |
中 (クラスター設定) |
中 (クラスター設定) |
低 (フルマネージド) |
低 (サーバーレス) |
チームの専門知識が必要 |
Minimal |
OpenSearch または Elasticsearch |
PostgreSQL、SQL |
MongoDB |
Redis |
グラフデータベース |
Amazon S3、基本的なベクトルの概念 |
マネージドサービス – Amazon Bedrock ナレッジベース
Amazon Bedrock ナレッジベースは、複数のベクトルストレージオプションを備えたフルマネージドソリューションを提供します。次の表は、これらのストレージオプションを比較したものです。
機能 |
pgvector PostgreSQLwith |
Neptune 分析 |
OpenSearch Service サーバーレス |
Amazon S3 ベクトル |
Pinecone |
RedisEnterprise クラウド |
|---|---|---|---|---|---|---|
主なユースケース |
ベクトル RAG を使用したリレーショナル DB |
GraphRAG のグラフベースのベクトル検索 |
ナレッジ管理 RAG |
コスト最適化ベクトル RAG |
高性能ベクトル検索 |
インメモリベクトル検索 |
アーキテクチャ |
フルマネージドリレーショナル |
完全マネージド型グラフ分析 |
フルマネージドサーバーレス |
サーバーレスオブジェクトストレージ |
フルマネージドハイブリッドクラウド |
完全マネージド型インメモリ |
データモデル |
リレーショナルテーブル |
プロパティグラフ |
JSON ドキュメント |
オブジェクトストレージ |
専用ベクトル |
ベクトルを含むキー値 |
ベクトルストレージ |
pgvector 拡張機能経由 |
ネイティブグラフベクトル |
OpenSearch エンジン経由 |
ネイティブ Amazon S3 ベクトルストレージ |
ネイティブベクトルデータベース |
インメモリベクトル |
Amazon Bedrock の統合 |
ネイティブ |
ネイティブ |
ネイティブ |
ネイティブ |
ネイティブ |
ネイティブ |
自動取り込み |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
自動ベクトル化 |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
はい (Amazon Bedrock 経由) |
スケーリング |
Auto Scaling (Aurora サーバーレス) |
自動グラフスケーリング |
自動サーバーレス |
自動 (数十億のベクトル) |
Auto Scaling ポッド |
Auto Scaling クラスター |
クエリパフォーマンス |
リレーショナルまたはベクトルの場合は高 |
グラフベクトルの高 |
高 |
中 (100 ミリ秒以上のレイテンシー) |
非常に高い |
非常に高い |
最大ベクトル |
百万 (インスタンス依存) |
数十億 |
数十億 |
インデックスあたり 20 億 |
数十億 |
百万 (メモリ依存) |
その他の機能 |
SQL クエリ、ACID トランザクション |
グラフアルゴリズム、トラバーサル |
全文検索、分析 |
Amazon S3 ライフサイクル、階層化 |
メタデータフィルタリング、名前空間 |
Redis データ構造、キャッシュ |
コスト最適化 |
中程度 (Aurora サーバーレス) |
中程度 (キャパシティーユニット) |
高 (サーバーレス、pay-per-use制) |
非常に高い (最大 90% の節約) |
中程度 (ポッドベースの料金) |
低 (インメモリプレミアム) |
次の用途に適しています |
ハイブリッド SQL/ベクトルワークロード |
接続されたナレッジグラフ |
ベクトル検索を使用した全文 |
長期、低頻度のアクセスベクトル |
大規模なリアルタイムベクトル検索 |
超低レイテンシーのニーズ |
理想的なクエリパターン |
SQL クエリとベクトルクエリの混在 |
ベクトルを使用したグラフトラバーサル |
分析による頻繁な検索 |
取得頻度が低い (分から時間) |
高頻度リアルタイムクエリ |
1 秒あたり数百万のリクエスト |
Amazon Bedrock でのセットアップ |
Simple (Amazon Bedrock によって管理) |
Simple (Amazon Bedrock によって管理) |
Simple (Amazon Bedrock によって管理) |
Simple (Amazon Bedrock によって管理) |
Simple (Amazon Bedrock によって管理) |
Simple (Amazon Bedrock によって管理) |
データレジデンシー |
AWS リージョン |
AWS リージョン |
AWS リージョン |
AWS リージョン |
マルチクラウド (AWS その他) |
マルチクラウド (AWS その他) |
料金モデル |
インスタンス時間とストレージ |
キャパシティーユニットとストレージ |
コンピューティングとストレージ (サーバーレス) |
ストレージ、クエリ、転送 |
ポッド時間とストレージ |
ノード時間とストレージ |
個々のオプションとマネージドオプションの選択
考慮事項 |
個々のベクトル DB を選択する |
Amazon Bedrock ナレッジベースを選択する (マネージド) |
|---|---|---|
RAG の実装 |
RAG パイプラインを完全に制御したい |
最小限のセットアップでフルマネージド RAG が必要 |
カスタマイズ |
カスタム取得ロジックと前処理が必要です |
ニーズを満たす標準 RAG パターン |
既存のインフラストラクチャ |
データベースが既にデプロイされている |
新しく開始する場合、または管理を簡素化したい場合 |
チームに関する専門知識 |
チームにデータベース管理の専門知識がある |
インフラストラクチャではなくアプリケーションロジックに集中したい |
統合の複雑さ |
既存のシステムとの深い統合が必要 |
Amazon Bedrock モデルとの迅速な統合が必要 |
運用オーバーヘッド |
データベースオペレーションを管理できます |
オペレーション AWS を処理する場合 |
コスト構造 |
データベースの直接料金が望ましい |
Amazon Bedrock の統一された料金が望ましい |
市場投入までの時間 |
カスタム実装の時間がある |
迅速なデプロイが必要 |