個々のベクトルデータベースマネージドサービス – Amazon Bedrock ナレッジベース個々のオプションとマネージドオプションの選択

ベクトルデータベースの比較

AWS は、個々のベクトルデータベースからフルマネージドサービスである Amazon Bedrock ナレッジベースまで、ベクトル検索機能を実装するための複数のアプローチを提供します。これらのオプションを評価する際、組織はアーキテクチャ、スケーラビリティ、統合機能、パフォーマンス特性、セキュリティ機能など、さまざまな側面を考慮する必要があります。

個々のベクトルデータベース

次の表は、アーキテクチャ、スケーリング機能、データソース統合、パフォーマンス特性に焦点を当てた、個々の AWS ベクトルデータベースソリューションの主な機能の概要を示しています。

機能	Amazon Kendra	Amazon OpenSearch Service	pgvector を使用した Amazon RDS for PostgreSQLwith	Amazon DocumentDB	Amazon MemoryDB	Amazon Neptune Analytics	Amazon S3 Vectors
主なユースケース	エンタープライズ検索と RAG	分散検索と分析	ベクトルをサポートするリレーショナル DB	ベクトル検索を使用したドキュメント DB	リアルタイムインメモリベクトル検索	ベクトル検索によるグラフ分析	コスト最適化ベクトルストレージ
アーキテクチャ	フルマネージド型	分散クラスター	リレーショナルデータベース	ドキュメント指向	インメモリデータベース	グラフ分析エンジン	サーバーレスオブジェクトストレージ
データモデル	ドキュメントベース	JSON ドキュメント	リレーショナルテーブル	JSON ドキュメント	JSON を使用したキーと値	プロパティグラフ	オブジェクトストレージ
ベクトルディメンション	自動管理	最大 16,000	設定可能	最大 2,000 (インデックス付き）、16,000 (インデックスなし)	最大 32,768	設定可能	最大 4,096
インデックス作成方法	自動	HNSW、IVF	HNSW、IVFFlat	HNSW、IVFFlat	HNSW	ネイティブグラフとベクトル	自動
距離メトリクス	自動	コサイン、ユークリッド、ドット製品	コサイン、ユークリッド、内部製品	コサイン、ユークリッド、ドット製品	コサイン、ユークリッド、内部製品	コサイン、ユークリッド語	コサイン、ユークリッド語
クエリレイテンシー	1 秒未満	Sub-10 (GPU アクセラレーション)	10～100 ミリ秒	ミリ秒	ミリ秒未満	1 秒未満	Sub-100
スケーリングモデル	自動	水平 (ノードの追加)	垂直レプリカとリードレプリカ	水平 (インスタンスの追加)	垂直およびレプリカ	自動	自動 (サーバーレス)
最大ベクトル	マネージド	数十億 (クラスター依存)	百万 (インスタンス依存)	コレクションあたりの数百万	データベースあたり 100 万	数十億	インデックスあたり 20 億、バケットあたり 10,000 インデックス
スループット	高	非常に高い (数千の QPS)	中	高	非常に高い (1 日あたり数百万件のリクエスト)	高	中 (低頻度クエリに最適化)
データ耐久性	99.999999999% (11 9s)	レプリカで設定可能	99.99% (マルチ AZ)	99.99% (マルチ AZ)	99.99% (マルチ AZ)	99.99%	99.999999999% (11 9s)
整合性モデル	結果	結果 (設定可能)	強力 (ACID)	結果	強力	強力	強力
その他の機能	40 個以上のデータコネクタ、NLP	全文検索、分析、ダッシュボード	SQL クエリ、ACID トランザクション	MongoDB API の互換性	Redis API の互換性、キャッシュ	グラフアルゴリズム、トラバーサル	Amazon S3 統合、ライフサイクルポリシー
料金モデル	クエリとストレージあたりの支払い	インスタンス時間とストレージ	インスタンス時間とストレージ	インスタンス時間とストレージ	インスタンス時間とストレージ	キャパシティーユニットとストレージ	ストレージ、クエリ、データ転送
コスト最適化	使用状況ベース	リザーブドインスタンス、自動スケーリング	リザーブドインスタンス、Aurora Serverless	リザーブドインスタンス	リザーブドインスタンス	Auto-scaling	特殊な DBs節約
次の用途に適しています	最小限のセットアップでエンタープライズ検索	高スループット、低レイテンシーのクエリ	ハイブリッド SQL およびベクトルワークロード	ベクトルを必要とする MongoDB 互換アプリケーション	超低レイテンシーのリアルタイムアプリケーション	GraphRAG グラフとナレッジグラフ	長期で費用対効果の高いストレージ
理想的なクエリパターン	頻繁なエンタープライズ検索	高頻度リアルタイムクエリ	SQL クエリとベクトルクエリの混在	セマンティック検索を使用したドキュメントクエリ	1 日あたり数百万のリクエスト	ベクトル検索を使用したグラフトラバーサル	低頻度のクエリ (分～時間)
セットアップの複雑さ	低 (フルマネージド)	中 (クラスター設定)	中 (拡張設定)	中 (クラスター設定)	中 (クラスター設定)	低 (フルマネージド)	低 (サーバーレス)
チームの専門知識が必要	Minimal	OpenSearch または Elasticsearch	PostgreSQL、SQL	MongoDB	Redis	グラフデータベース	Amazon S3、基本的なベクトルの概念

マネージドサービス – Amazon Bedrock ナレッジベース

Amazon Bedrock ナレッジベースは、複数のベクトルストレージオプションを備えたフルマネージドソリューションを提供します。次の表は、これらのストレージオプションを比較したものです。

機能	pgvector PostgreSQLwith	Neptune 分析	OpenSearch Service サーバーレス	Amazon S3 ベクトル	Pinecone	RedisEnterprise クラウド
主なユースケース	ベクトル RAG を使用したリレーショナル DB	GraphRAG のグラフベースのベクトル検索	ナレッジ管理 RAG	コスト最適化ベクトル RAG	高性能ベクトル検索	インメモリベクトル検索
アーキテクチャ	フルマネージドリレーショナル	完全マネージド型グラフ分析	フルマネージドサーバーレス	サーバーレスオブジェクトストレージ	フルマネージドハイブリッドクラウド	完全マネージド型インメモリ
データモデル	リレーショナルテーブル	プロパティグラフ	JSON ドキュメント	オブジェクトストレージ	専用ベクトル	ベクトルを含むキー値
ベクトルストレージ	pgvector 拡張機能経由	ネイティブグラフベクトル	OpenSearch エンジン経由	ネイティブ Amazon S3 ベクトルストレージ	ネイティブベクトルデータベース	インメモリベクトル
Amazon Bedrock の統合	ネイティブ	ネイティブ	ネイティブ	ネイティブ	ネイティブ	ネイティブ
自動取り込み	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)
自動ベクトル化	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)	はい (Amazon Bedrock 経由)
スケーリング	Auto Scaling (Aurora サーバーレス)	自動グラフスケーリング	自動サーバーレス	自動 (数十億のベクトル)	Auto Scaling ポッド	Auto Scaling クラスター
クエリパフォーマンス	リレーショナルまたはベクトルの場合は高	グラフベクトルの高	高	中 (100 ミリ秒以上のレイテンシー)	非常に高い	非常に高い
最大ベクトル	百万 (インスタンス依存)	数十億	数十億	インデックスあたり 20 億	数十億	百万 (メモリ依存)
その他の機能	SQL クエリ、ACID トランザクション	グラフアルゴリズム、トラバーサル	全文検索、分析	Amazon S3 ライフサイクル、階層化	メタデータフィルタリング、名前空間	Redis データ構造、キャッシュ
コスト最適化	中程度 (Aurora サーバーレス)	中程度 (キャパシティーユニット)	高 (サーバーレス、pay-per-use制)	非常に高い (最大 90% の節約)	中程度 (ポッドベースの料金)	低 (インメモリプレミアム)
次の用途に適しています	ハイブリッド SQL/ベクトルワークロード	接続されたナレッジグラフ	ベクトル検索を使用した全文	長期、低頻度のアクセスベクトル	大規模なリアルタイムベクトル検索	超低レイテンシーのニーズ
理想的なクエリパターン	SQL クエリとベクトルクエリの混在	ベクトルを使用したグラフトラバーサル	分析による頻繁な検索	取得頻度が低い (分から時間)	高頻度リアルタイムクエリ	1 秒あたり数百万のリクエスト
Amazon Bedrock でのセットアップ	Simple (Amazon Bedrock によって管理)	Simple (Amazon Bedrock によって管理)	Simple (Amazon Bedrock によって管理)	Simple (Amazon Bedrock によって管理)	Simple (Amazon Bedrock によって管理)	Simple (Amazon Bedrock によって管理)
データレジデンシー	AWS リージョン	AWS リージョン	AWS リージョン	AWS リージョン	マルチクラウド (AWS その他)	マルチクラウド (AWS その他)
料金モデル	インスタンス時間とストレージ	キャパシティーユニットとストレージ	コンピューティングとストレージ (サーバーレス)	ストレージ、クエリ、転送	ポッド時間とストレージ	ノード時間とストレージ

個々のオプションとマネージドオプションの選択

考慮事項	個々のベクトル DB を選択する	Amazon Bedrock ナレッジベースを選択する (マネージド)
RAG の実装	RAG パイプラインを完全に制御したい	最小限のセットアップでフルマネージド RAG が必要
カスタマイズ	カスタム取得ロジックと前処理が必要です	ニーズを満たす標準 RAG パターン
既存のインフラストラクチャ	データベースが既にデプロイされている	新しく開始する場合、または管理を簡素化したい場合
チームに関する専門知識	チームにデータベース管理の専門知識がある	インフラストラクチャではなくアプリケーションロジックに集中したい
統合の複雑さ	既存のシステムとの深い統合が必要	Amazon Bedrock モデルとの迅速な統合が必要
運用オーバーヘッド	データベースオペレーションを管理できます	オペレーション AWS を処理する場合
コスト構造	データベースの直接料金が望ましい	Amazon Bedrock の統一された料金が望ましい
市場投入までの時間	カスタム実装の時間がある	迅速なデプロイが必要

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ベクトルデータベースオプション

コストの比較と考慮事項