翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ベクトルデータベースオプション
AWS は、生成 AI アプリケーションのさまざまなユースケースと要件をサポートするさまざまなベクトルデータベースソリューションを提供します。これらのオプションは、個々のデータベースサービスとマネージドサービスに広く分類でき、それぞれに異なる特性と利点があります。これらのオプションを理解することは、最適なパフォーマンス、スケーラビリティ、コスト効率を維持しながら、ベクトル検索機能を効果的に実装することを検討している組織にとって不可欠です。
ベクトルデータベースソリューションの詳細については、以下のセクションを参照してください。
個々のベクトルデータベースオプション
の個々のベクトルデータベースオプション AWS には、Amazon Kendra、Amazon OpenSearch Service、pgvector を使用した Amazon RDS for PostgreSQL、Amazon MemoryDB、Amazon DocumentDB、Amazon Neptune Analytics、Amazon S3 Vector などがあります。(オープンソースの拡張機能である pgvector は、ML が生成したベクトル埋め込みを保存および検索する機能を追加します)。これらのソリューションはベクトル検索にさまざまなアプローチを提供し、組織は既存のインフラストラクチャ、技術要件、特定のユースケースに基づいて選択できます。
Amazon Kendra
Amazon Kendra は、自然言語処理と高度な機械学習アルゴリズムを使用して、データからの検索質問に対する特定の回答を返すエンタープライズグレードのインテリジェント検索サービスです。Amazon Kendra は検索機能の実装を簡素化し、生成 AI アプリケーションのための効果的なバックエンドソリューションです。
Amazon Kendra のその他の主要な機能は次のとおりです。
-
40 を超えるデータソース
へのネイティブ接続 -
組み込みのデータ準備機能
-
技術的な深い専門知識を必要としない高速セットアップ
Amazon Kendra の利点は次のとおりです。
-
自動データ処理 (チャンキング、取り込み、取り出し)
-
強力なカスタマイズオプション:
-
を介したシンプルなプログラムによるアクセス AWS SDK for Python (Boto3)
詳細については、Amazon Kendra ドキュメントの「Amazon Kendra の利点」を参照してください。
Amazon OpenSearch Service
Amazon OpenSearch Service は、 で OpenSearch Service クラスターをデプロイ、運用、スケーリングするのに役立つマネージドサービスです AWS クラウド。
OpenSearch Service の主な機能は次のとおりです。
-
オープンソースの検索および分析エンジン
-
分散アーキテクチャ
-
リアルタイムデータ処理
OpenSearch Service を使用する利点には、次のようなものがあります。
-
水平スケーラビリティ
-
RESTful API のサポート
-
構造化データと非構造化データを処理します
-
リアルタイムデータ分析
-
さまざまなデプロイサイズに適しています
詳細については、OpenSearch Service ドキュメントの「Amazon OpenSearch Service の機能」を参照してください。
pgvector を使用した Amazon RDS for PostgreSQL
Amazon RDS for PostgreSQL with pgvector
pgvector を使用した Amazon RDS for PostgreSQL の主な利点は次のとおりです。
-
高可用性
-
自動フェイルオーバー
-
コスト効率 (pay-per-use制)
-
組み込みモニタリング
-
リアルタイムベクトルデータ統合
詳細については、Amazon RDS ドキュメントの「Amazon RDS の利点」を参照してください。
Amazon DocumentDB
Amazon DocumentDB (MongoDB 互換) は、バージョン 5.0 以降のネイティブベクトル検索機能を提供するドキュメントデータベースです。JSON ベースのドキュメントストレージの柔軟性とベクトル検索を組み合わせることで、階層ナビゲーション可能なスモールワールド (HNSW) と Inverted File Flat (IVFFlat) の両方のインデックス作成方法をサポートしています。
Amazon DocumentDB の主な機能は次のとおりです。
-
最大 2,000 個のディメンション (インデックス作成なしで最大 16,000 個のディメンション) のベクトルを保存およびインデックス作成
-
ベクトル類似度検索のミリ秒応答時間
-
euclidean、cosine、dot の製品距離メトリクスのサポート
-
既存の MongoDB 互換アプリケーションとのシームレスな統合
以下の状況で Amazon DocumentDB を使用します。
-
MongoDB API APIsしていて、ベクトル検索機能が必要なアプリケーションの場合
-
セマンティック検索と組み合わせた柔軟なドキュメントデータ構造を必要とするユースケースの場合
-
従来のドキュメントクエリとベクトル類似度検索の両方を必要とするシナリオの場合
-
製品のレコメンデーション、パーソナライゼーション、チャットアシスタント、不正検出を提供するアプリケーション向け
詳細については、Amazon DocumentDB ドキュメントの「Amazon DocumentDB のベクトル検索」を参照してください。 Amazon DocumentDB
Amazon MemoryDB
Amazon MemoryDB は Redis 互換のインメモリデータベースで、一般的なベクトルデータベースの中で最速のベクトル検索パフォーマンスを提供します AWS。マルチアベイラビリティーゾーンの耐久性を備えたミリ秒未満のクエリレイテンシーを提供します。
MemoryDB の主な機能は次のとおりです。
-
アプリケーションデータと数百万のベクトルを 1 つのデータベースに保存
-
1 桁ミリ秒のクエリと更新の応答時間
-
で最高の再現率と最速のパフォーマンス AWS
-
ベクトルあたり最大 32,768 ディメンションのサポート
-
リアルタイムのセマンティック検索およびキャッシュ機能
次の状況で MemoryDB を使用します。
-
超低レイテンシー (10 ミリ秒未満) を必要とするリアルタイムアプリケーションの場合
-
1 日あたり数百万リクエストの高スループットワークロードの場合
-
リアルタイムレコメンデーションエンジン、セマンティックキャッシュ、異常検出などのユースケース向け
-
インメモリデータストアとベクトル検索機能の両方を必要とするアプリケーションの場合
詳細については、MemoryDB ドキュメントの「ベクトル検索」を参照してください。 MemoryDB
Amazon Neptune Analytics
Amazon Neptune Analytics は、ネイティブベクトル検索機能を提供するグラフ分析エンジンであり、Graph Retrieval Augmented Generation (GraphRAG) のユースケースに最適です。ベクトル類似度検索とグラフトラバーサルおよびアルゴリズムを組み合わせます。
Neptune Analytics の主な機能は次のとおりです。
-
数秒で何十億もの関係を分析する
-
ベクトル検索とグラフアルゴリズムを組み合わせる (パス検出、コミュニティ検出、中心性)
-
トポロジに関する知識を持つ GraphRAG アプリケーションのサポート
-
既存のグラフ分析ソリューションよりも最大 80 倍高速
-
フルマネージド GraphRAG 用の Amazon Bedrock との統合
Neptune Analytics は、以下の状況で使用します。
-
ベクトル埋め込みを含むナレッジグラフを必要とする GraphRAG アプリケーションの場合
-
ベクトルの類似性とともに複雑な関係をトラバースする必要があるユースケースの場合
-
関係コンテキストで説明可能な AI レスポンスを必要とするアプリケーションの場合
-
Customer 360 ビュー、不正検出ネットワーク、ナレッジ検出などのシナリオの場合
詳細については、Amazon Neptune Analytics のドキュメントを参照してください。
Amazon S3 Vectors
Amazon S3 Vectors は、 AWS ネイティブベクトルストレージとクエリ機能を備えた の最初のクラウドオブジェクトストアです。大規模な規模を必要とする AI アプリケーション向けに、専用のコスト最適化ベクトルストレージを提供します。
Amazon S3 Vectors の主な機能は次のとおりです。
-
ベクトルバケットあたり最大 10,000 個のインデックスをサポートする、インデックスあたり最大 20 億個のベクトルのストレージ
-
長期ストレージと低頻度アクセスパターン用に最適化された Sub-100 ミリ秒未満のクエリレイテンシー
-
特殊なベクトルデータベースと比較して、ベクトルオペレーションのコストを最大 90% 削減
-
自動スケーリングと 99.999999999% (11 9s) の耐久性を備えたサーバーレスアーキテクチャ
以下の状況では Amazon S3 Vectors を使用します。
-
最小限のコストで数十億のベクトルのストレージを必要とするアプリケーション向け
-
10 ミリ秒未満ではなく 1 秒未満のクエリレイテンシー (100 ミリ秒以上) を許容するワークロードの場合
-
長期ベクトル保持とアーカイブのユースケースの場合
-
取得パターンの頻度が低い RAG アプリケーションの場合
-
超低レイテンシーよりもストレージの経済性を優先する組織向け
Amazon S3 Vectors は Amazon Bedrock ナレッジベースとネイティブに統合され、Amazon OpenSearch Service の階層型アーキテクチャでうまく機能します。コールドストレージには Amazon S3 Vectors を使用し、ホットクエリには OpenSearch Service を使用できます。
詳細については、Amazon S3 ドキュメントの「S3 ベクトルとベクトルバケットの使用」を参照してください。 Amazon S3
マネージドサービスオプション
Amazon Bedrock ナレッジベースは、ベクトルデータベースの実装に対する AWS フルマネージド型のアプローチを表します。このサービスのストレージオプションの柔軟性と自動管理機能は、複雑なインフラストラクチャを管理せずに RAG を実装しようとしている組織にとって特に役立ちます。
Amazon Bedrock ナレッジベースを使用すると、RAG を使用して基盤モデルを強化するナレッジベースを作成、保守、クエリできます。このサービスは、データの取り込み、ベクトル化、取得パイプライン全体を管理することで、RAG を実装する複雑なプロセスを簡素化します。
Amazon Bedrock ナレッジベースの主な利点は次のとおりです。
-
データ処理の簡素化
-
データの自動取り込みとチャンキング
-
複数のファイル形式からの組み込みテキスト抽出
-
マネージドベクトル埋め込みの生成
-
メタデータの自動抽出とインデックス作成
-
-
効率的な RAG 実装
-
事前設定された取得戦略
-
自動コンテキストウィンドウの最適化
-
組み込みの関連性チューニング
-
すぐに使えるセマンティック検索機能
-
-
セキュリティとガバナンス
-
統合 AWS Identity and Access Management (IAM) コントロール
-
保管中および転送中のデータ暗号化
-
VPC サポート
-
を使用した監査ログ記録 AWS CloudTrail
-
Amazon Bedrock ナレッジベースは、以下を含む複数のベクトルストアオプションをサポートしています。
-
pgvector を使用した Amazon Aurora PostgreSQL
-
Amazon Neptune Analytics
-
Amazon EMR Serverless
-
Amazon S3 Vectors
-
Pinecone
-
Redis エンタープライズクラウド
このマネージドサービスは、自動データ取り込み、ベクトル化、取得を処理します。これにより、RAG の実装が簡素化されます。
サポートされている各ベクトルストアの詳細については、Amazon Bedrock ナレッジベースのドキュメントを参照してください。
適切なベクトルデータベースの選択
これらの主要な決定要因に基づいてベクトルデータベースを選択します。
-
ベクトル検索で MongoDB 互換ドキュメントデータベースが必要な場合は、Amazon DocumentDB を選択します。これは、アプリケーションが MongoDB APIs を使用していて、個別のベクトルインフラストラクチャを管理せずにセマンティック検索機能を追加する場合に最適です。
-
リアルタイムアプリケーションに超低レイテンシーが必要な場合は、Amazon MemoryDB を選択します。これにより、ミリ秒未満の応答時間 AWS で で最速のベクトル検索パフォーマンスが得られます。リアルタイムのレコメンデーションエンジンや高スループットアプリケーションに最適です。
-
ベクトル検索でグラフベースのナレッジ表現が必要な場合は、Amazon Neptune Analytics を選択します。これは、複雑な関係を横断し、ベクトル検索とともにグラフベースのクエリを実行し、説明可能な AI レスポンスを提供する必要がある GraphRAG アプリケーションに最適です。
-
リレーショナルクエリとベクトル検索を組み合わせる必要がある場合 – Amazon Aurora PostgreSQL と pgvector を選択します。このオプションは、アプリケーションが同じデータベース内で従来の SQL オペレーションとベクトル類似度検索の両方を必要とする場合に最適です。
-
レイテンシーが 10 ミリ秒未満の高スループットクエリが必要な場合は、Amazon OpenSearch Service を選択します。高頻度クエリとリアルタイムアプリケーションの処理に優れており、最近の GPU アクセラレーションの改善が含まれています。
-
数十億のベクトルを費用対効果の高い方法で保存する必要がある場合 – Amazon S3 Vectors を選択します。このオプションは最大 90% のコスト削減を実現し、100 ミリ秒未満のレイテンシーを許容できる取得パターン (クエリ間の数分から数時間) が少ないアプリケーションに最適です。
-
ベクトル検索とともに全文検索が必要な場合は、Amazon OpenSearch Service を選択します。このオプションは、強力な全文検索機能とベクトル検索を単一のプラットフォームで組み合わせます。