View a markdown version of this page

ベクトルデータベースの比較 - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ベクトルデータベースの比較

AWS は、個々のベクトルデータベースからフルマネージドサービスである Amazon Bedrock ナレッジベースまで、ベクトル検索機能を実装するための複数のアプローチを提供します。これらのオプションを評価する際、組織はアーキテクチャ、スケーラビリティ、統合機能、パフォーマンス特性、セキュリティ機能など、さまざまな側面を考慮する必要があります。

個々のベクトルデータベース

次の表は、アーキテクチャ、スケーリング機能、データソース統合、パフォーマンス特性に焦点を当てた、個々の AWS ベクトルデータベースソリューションの主な機能の概要を示しています。

機能

Amazon Kendra

Amazon OpenSearch Service

pgvector を使用した Amazon RDS for PostgreSQLwith

Amazon DocumentDB

Amazon MemoryDB

Amazon Neptune Analytics

Amazon S3 Vectors

主なユースケース

エンタープライズ検索と RAG

分散検索と分析

ベクトルをサポートするリレーショナル DB

ベクトル検索を使用したドキュメント DB

リアルタイムインメモリベクトル検索

ベクトル検索によるグラフ分析

コスト最適化ベクトルストレージ

アーキテクチャ

フルマネージド型

分散クラスター

リレーショナルデータベース

ドキュメント指向

インメモリデータベース

グラフ分析エンジン

サーバーレスオブジェクトストレージ

データモデル

ドキュメントベース

JSON ドキュメント

リレーショナルテーブル

JSON ドキュメント

JSON を使用したキーと値

プロパティグラフ

オブジェクトストレージ

ベクトルディメンション

自動管理

最大 16,000

設定可能

最大 2,000 (インデックス付き)、16,000 (インデックスなし)

最大 32,768

設定可能

最大 4,096

インデックス作成方法

自動

HNSW、IVF

HNSW、IVFFlat

HNSW、IVFFlat

HNSW

ネイティブグラフとベクトル

自動

距離メトリクス

自動

コサイン、ユークリッド、ドット製品

コサイン、ユークリッド、内部製品

コサイン、ユークリッド、ドット製品

コサイン、ユークリッド、内部製品

コサイン、ユークリッド語

コサイン、ユークリッド語

クエリレイテンシー

1 秒未満

Sub-10 (GPU アクセラレーション)

10~100 ミリ秒

ミリ秒

ミリ秒未満

1 秒未満

Sub-100

スケーリングモデル

自動

水平 (ノードの追加)

垂直レプリカとリードレプリカ

水平 (インスタンスの追加)

垂直およびレプリカ

自動

自動 (サーバーレス)

最大ベクトル

マネージド

数十億 (クラスター依存)

百万 (インスタンス依存)

コレクションあたりの数百万

データベースあたり 100 万

数十億

インデックスあたり 20 億、バケットあたり 10,000 インデックス

スループット

非常に高い (数千の QPS)

非常に高い (1 日あたり数百万件のリクエスト)

中 (低頻度クエリに最適化)

データ耐久性

99.999999999% (11 9s)

レプリカで設定可能

99.99% (マルチ AZ)

99.99% (マルチ AZ)

99.99% (マルチ AZ)

99.99%

99.999999999% (11 9s)

整合性モデル

結果

結果 (設定可能)

強力 (ACID)

結果

強力

強力

強力

その他の機能

40 個以上のデータコネクタ、NLP

全文検索、分析、ダッシュボード

SQL クエリ、ACID トランザクション

MongoDB API の互換性

Redis API の互換性、キャッシュ

グラフアルゴリズム、トラバーサル

Amazon S3 統合、ライフサイクルポリシー

料金モデル

クエリとストレージあたりの支払い

インスタンス時間とストレージ

インスタンス時間とストレージ

インスタンス時間とストレージ

インスタンス時間とストレージ

キャパシティーユニットとストレージ

ストレージ、クエリ、データ転送

コスト最適化

使用状況ベース

リザーブドインスタンス、自動スケーリング

リザーブドインスタンス、Aurora Serverless

リザーブドインスタンス

リザーブドインスタンス

Auto-scaling

特殊な DBs節約

次の用途に適しています

最小限のセットアップでエンタープライズ検索

高スループット、低レイテンシーのクエリ

ハイブリッド SQL およびベクトルワークロード

ベクトルを必要とする MongoDB 互換アプリケーション

超低レイテンシーのリアルタイムアプリケーション

GraphRAG グラフとナレッジグラフ

長期で費用対効果の高いストレージ

理想的なクエリパターン

頻繁なエンタープライズ検索

高頻度リアルタイムクエリ

SQL クエリとベクトルクエリの混在

セマンティック検索を使用したドキュメントクエリ

1 日あたり数百万のリクエスト

ベクトル検索を使用したグラフトラバーサル

低頻度のクエリ (分~時間)

セットアップの複雑さ

低 (フルマネージド)

中 (クラスター設定)

中 (拡張設定)

中 (クラスター設定)

中 (クラスター設定)

低 (フルマネージド)

低 (サーバーレス)

チームの専門知識が必要

Minimal

OpenSearch または Elasticsearch

PostgreSQL、SQL

MongoDB

Redis

グラフデータベース

Amazon S3、基本的なベクトルの概念

マネージドサービス – Amazon Bedrock ナレッジベース

Amazon Bedrock ナレッジベースは、複数のベクトルストレージオプションを備えたフルマネージドソリューションを提供します。次の表は、これらのストレージオプションを比較したものです。

機能

pgvector PostgreSQLwith

Neptune 分析

OpenSearch Service サーバーレス

Amazon S3 ベクトル

Pinecone

RedisEnterprise クラウド

主なユースケース

ベクトル RAG を使用したリレーショナル DB

GraphRAG のグラフベースのベクトル検索

ナレッジ管理 RAG

コスト最適化ベクトル RAG

高性能ベクトル検索

インメモリベクトル検索

アーキテクチャ

フルマネージドリレーショナル

完全マネージド型グラフ分析

フルマネージドサーバーレス

サーバーレスオブジェクトストレージ

フルマネージドハイブリッドクラウド

完全マネージド型インメモリ

データモデル

リレーショナルテーブル

プロパティグラフ

JSON ドキュメント

オブジェクトストレージ

専用ベクトル

ベクトルを含むキー値

ベクトルストレージ

pgvector 拡張機能経由

ネイティブグラフベクトル

OpenSearch エンジン経由

ネイティブ Amazon S3 ベクトルストレージ

ネイティブベクトルデータベース

インメモリベクトル

Amazon Bedrock の統合

ネイティブ

ネイティブ

ネイティブ

ネイティブ

ネイティブ

ネイティブ

自動取り込み

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

自動ベクトル化

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

はい (Amazon Bedrock 経由)

スケーリング

Auto Scaling (Aurora サーバーレス)

自動グラフスケーリング

自動サーバーレス

自動 (数十億のベクトル)

Auto Scaling ポッド

Auto Scaling クラスター

クエリパフォーマンス

リレーショナルまたはベクトルの場合は高

グラフベクトルの高

中 (100 ミリ秒以上のレイテンシー)

非常に高い

非常に高い

最大ベクトル

百万 (インスタンス依存)

数十億

数十億

インデックスあたり 20 億

数十億

百万 (メモリ依存)

その他の機能

SQL クエリ、ACID トランザクション

グラフアルゴリズム、トラバーサル

全文検索、分析

Amazon S3 ライフサイクル、階層化

メタデータフィルタリング、名前空間

Redis データ構造、キャッシュ

コスト最適化

中程度 (Aurora サーバーレス)

中程度 (キャパシティーユニット)

高 (サーバーレス、pay-per-use制)

非常に高い (最大 90% の節約)

中程度 (ポッドベースの料金)

低 (インメモリプレミアム)

次の用途に適しています

ハイブリッド SQL/ベクトルワークロード

接続されたナレッジグラフ

ベクトル検索を使用した全文

長期、低頻度のアクセスベクトル

大規模なリアルタイムベクトル検索

超低レイテンシーのニーズ

理想的なクエリパターン

SQL クエリとベクトルクエリの混在

ベクトルを使用したグラフトラバーサル

分析による頻繁な検索

取得頻度が低い (分から時間)

高頻度リアルタイムクエリ

1 秒あたり数百万のリクエスト

Amazon Bedrock でのセットアップ

Simple (Amazon Bedrock によって管理)

Simple (Amazon Bedrock によって管理)

Simple (Amazon Bedrock によって管理)

Simple (Amazon Bedrock によって管理)

Simple (Amazon Bedrock によって管理)

Simple (Amazon Bedrock によって管理)

データレジデンシー

AWS リージョン

AWS リージョン

AWS リージョン

AWS リージョン

マルチクラウド (AWS その他)

マルチクラウド (AWS その他)

料金モデル

インスタンス時間とストレージ

キャパシティーユニットとストレージ

コンピューティングとストレージ (サーバーレス)

ストレージ、クエリ、転送

ポッド時間とストレージ

ノード時間とストレージ

個々のオプションとマネージドオプションの選択

考慮事項

個々のベクトル DB を選択する

Amazon Bedrock ナレッジベースを選択する (マネージド)

RAG の実装

RAG パイプラインを完全に制御したい

最小限のセットアップでフルマネージド RAG が必要

カスタマイズ

カスタム取得ロジックと前処理が必要です

ニーズを満たす標準 RAG パターン

既存のインフラストラクチャ

データベースが既にデプロイされている

新しく開始する場合、または管理を簡素化したい場合

チームに関する専門知識

チームにデータベース管理の専門知識がある

インフラストラクチャではなくアプリケーションロジックに集中したい

統合の複雑さ

既存のシステムとの深い統合が必要

Amazon Bedrock モデルとの迅速な統合が必要

運用オーバーヘッド

データベースオペレーションを管理できます

オペレーション AWS を処理する場合

コスト構造

データベースの直接料金が望ましい

Amazon Bedrock の統一された料金が望ましい

市場投入までの時間

カスタム実装の時間がある

迅速なデプロイが必要