ナレッジベースのクエリを実行してデータを取得する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ナレッジベースのクエリを実行してデータを取得する

重要

ガードレールは、入力と LLM から生成されたレスポンスにのみ適用されます。実行時にナレッジベースから取得したリファレンスには適用されません。

ナレッジ ベースを設定したら、それについてクエリを実行し、Retrieve API オペレーションを使用して、そのクエリに関連するソースデータからチャンクを取得できます。デフォルトの Amazon Bedrock ナレッジベースランカーではなく再ランク付けモデルを使用して、取得中にソースチャンクの関連性をランク付けすることもできます。

ナレッジベースのクエリを実行する方法については、任意の方法のタブを選択し、その手順を実行してください。

Console
ナレッジベースをテストするには
  1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用して にサインインします。Amazon Bedrock コンソール (https://console.aws.amazon.com/bedrock) を開きます。

  2. 左側のナビゲーションペインで [ナレッジベース] を選択します。

  3. [ナレッジベース] セクションで、次のいずれかの操作を行います。

    • テストするナレッジベースの横にあるラジオボタンを選択して、[ナレッジベースをテストする] を選択します。右側からテスウィンドウが表示されます。

    • テストするナレッジベースを選択します。右側からテスウィンドウが表示されます。

  4. テストウィンドウで、[クエリに対する応答を生成する] をクリアして、ナレッジベースから直接取得した情報を返します。

  5. (オプション) 設定アイコン ( Three horizontal sliders with adjustable circular controls for settings or parameters. ) を選択して、[設定] を開きます。構成については、「クエリとレスポンスの生成を設定してカスタマイズする」を参照してください。

  6. チャットウィンドウのテキストボックスにクエリを入力して [実行] を選択すると、ナレッジベースからのレスポンスが表示されます。

  7. ソースチャンクは関連性の高い順に直接返されます。データソースから抽出された画像もソースチャンクとして返される可能性があります。

  8. 返されたチャンクの詳細を表示するには、[ソースの詳細を表示] を選択します。

    • クエリの設定を表示するには、[クエリ設定] を展開します。

    • ソースチャンクの詳細を表示するには、ソースチャンクの横の右矢印 ( Play button icon with a triangular shape pointing to the right. ) を選択して展開します。以下の情報が表示されます。

      • ソースチャンクからの未加工テキスト。このテキストをコピーするには、コピーアイコン ( Icon representing a crop or resize function, with two overlapping rectangles. ) を選択します。Amazon S3 を使用してデータを保存した場合は、外部リンクアイコン ( Icon of a square with an arrow pointing outward from its top-right corner. ) を選択して、対象ファイルを含む S3 オブジェクトに移動します。

      • Amazon S3 を使用してデータを保存した場合、ソースチャンクに関連付けられているメタデータ。属性/フィールドのキーと値は、ソースドキュメントに関連付けられている .metadata.json ファイルで定義されています。詳細については、「クエリとレスポンスの生成を設定してカスタマイズする」の「メタデータとフィルタリング」セクションを参照してください。

チャットオプション
  • [回答を生成] をオンにして、取得したソースチャンクに基づいて応答を生成するように切り替えます。設定を変更すると、チャットウィンドウ内のテキストは完全に消去されます。

  • チャットウィンドウ内のテキストを消去するには、ほうきアイコン ( Magnifying glass icon with a checkmark inside, symbolizing search or inspection. ) を選択します。

  • チャットウィンドウ内のすべての出力をコピーするには、コピーアイコン ( Icon representing a crop or resize function, with two overlapping rectangles. ) を選択します。

API

ナレッジベースのクエリを実行し、データソースから関連するテキストのみを返すには、Amazon Bedrock エージェントのランタイムエンドポイントを使用して Retrieve リクエストを送信します。

以下のフィールドが必要です。

フィールド 基本的な説明
knowledgeBaseId クエリを実行するナレッジベースを指定します。
retrievalQuery クエリを指定する text フィールドが含まれます。
guardrailsConfiguration リクエストでガードレールを使用するために、guardrailsIdguardrailsVersion などの guardrailsConfiguration フィールドを含めます。

次のフィールドはオプションです。

フィールド ユースケース
nextToken 応答の次のバッチを返します (以下の応答フィールドを参照)。
retrievalConfiguration ベクトル検索をカスタマイズするためのクエリ設定が含まれます。詳細については、「KnowledgeBaseVectorSearchConfiguration」を参照してください。

KnowledgeBaseVectorSearchConfigurationrerankingConfiguration フィールドを含めることで、デフォルトの Amazon Bedrock ナレッジベースのランキングモデルよりも再ランク付けモデルを優先して使用できます。rerankingConfiguration フィールドは VectorSearchRerankingConfiguration オブジェクトにマッピングされています。このオブジェクトでは、使用する再ランキングモデル、含める追加のリクエストフィールド、再ランキング中にドキュメントを除外するメタデータ属性、および再ランク付け後に返される結果の数を指定できます。詳細については、「VectorSearchRerankingConfiguration」を参照してください。

注記

指定した numberOfRerankedResults 値が KnowledgeBaseVectorSearchConfigurationnumberOfResults 値より大きい場合、返される結果の最大数は numberOfResults の値になります。例外は、クエリ分解を使用する場合です (詳細については、「クエリとレスポンスの生成を設定してカスタマイズする」の「クエリの変更」セクションを参照してください)。クエリ分解を使用する場合、numberOfRerankedResultsnumberOfResults の最大 5 倍になります。

応答では、データソースからのソースチャンクが、retrievalResults フィールドの KnowledgeBaseRetrievalResult オブジェクトの配列として返されます。各 KnowledgeBaseRetrievalResult には、次のフィールドが含まれます。

フィールド 説明
content text にテキストソースチャンクが含まれるか、byteContent フィールドに画像ソースチャンクが含まれますコンテンツが画像の場合、base64 でエンコードされたコンテンツのデータ URI は data:image/jpeg;base64,${base64-encoded string} の形式で返されます。
メタデータ 各メタデータ属性をキーとして、メタデータ値をキーがマッピングする JSON 値として含めます。
location ソースチャンクが属するドキュメントの URI または URL が含まれます。
score ドキュメントの関連性スコア。このスコアを使用して、結果のランキングを分析できます。

ソースチャンクの数が応答に収まる数を超えると、nextToken フィールドに値が返されます。結果の次のバッチを返すには、別のリクエストでその値を使用します。

取得したデータに画像が含まれている場合、レスポンスは次のレスポンスヘッダーも返します。これには、レスポンスで返されたソースチャンクのメタデータが含まれます。

  • x-amz-bedrock-kb-byte-content-source – 画像の Amazon S3 URI が含まれます。

  • x-amz-bedrock-kb-description – 画像の Base64 でエンコードされた文字列が含まれます。

注記

メタデータフィルターを設定するときに、これらのメタデータレスポンスヘッダーをフィルタリングすることはできません。

マルチモーダルクエリ

マルチモーダル埋め込みモデルを使用するナレッジベースの場合、テキストに加えてイメージを使用してクエリを実行できます。retrievalQuery フィールドは、イメージクエリの multimodalInputList フィールドをサポートします。

注記

Nova アプローチと BDA アプローチの選択など、マルチモーダルナレッジベースの設定と操作に関する包括的なガイダンスについては、「」を参照してくださいマルチモーダルコンテンツのナレッジベースを構築する

{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "text": "Find similar shoes", "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }

また、 textフィールドを省略してイメージでクエリを実行することもできます。

{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }

一般的なマルチモーダルクエリパターン

Image-to-image検索

イメージをアップロードして、視覚的に似たイメージを見つけます。例: 赤い Nike 靴の写真をアップロードして、製品カタログで同様の靴を見つけます。

テキスト + イメージの絞り込み

テキストとイメージを組み合わせることで、より正確な結果が得られます。例: 「類似する靴を見つけるが、色が異なる」と、アップロードされた靴の画像。

ビジュアルドキュメント検索

ドキュメント内のグラフ、図、またはビジュアル要素を検索します。例: グラフイメージをアップロードして、ドキュメントコレクション内の同様のグラフを検索します。

マルチモーダルコンテンツの Nova と BDA の選択

マルチモーダルコンテンツを使用する場合は、コンテンツタイプとクエリパターンに基づいてアプローチを選択します。

Nova と BDA 決定マトリックス
コンテンツタイプ Nova マルチモーダル埋め込みを使用する Bedrock Data Automation (BDA) パーサーを使用する
動画コンテンツ ビジュアルストーリーテリングの焦点 (スポーツ、広告、デモンストレーション)、ビジュアル要素に関するクエリ、最小限の音声コンテンツ 重要な音声/ナレーション (プレゼンテーション、会議、チュートリアル)、音声コンテンツに関するクエリ、文字起こしが必要
オーディオコンテンツ 音楽またはサウンド効果の識別、非音声分析 ポッドキャスト、インタビュー、会議、文字起こしが必要な音声を含むコンテンツ
イメージコンテンツ ビジュアル類似度検索、image-to-image取得、ビジュアルコンテンツ分析 イメージからのテキスト抽出、ドキュメント処理、OCR 要件
注記

Nova マルチモーダル埋め込みでは、音声コンテンツを直接処理することはできません。音声ファイルまたは動画ファイルに重要な音声情報が含まれている場合は、まず BDA パーサーを使用して音声をテキストに変換するか、代わりにテキスト埋め込みモデルを選択します。

マルチモーダルクエリの制限

  • 現在のリリースでは、クエリごとに最大 1 つのイメージ

  • イメージクエリは、マルチモーダル埋め込みモデル (Titan G1 または Cohere Embed v3) でのみサポートされます。

  • RetrieveAndGenerate API は、マルチモーダル埋め込みモデルと S3 コンテンツバケットを持つナレッジベースではサポートされていません

  • テキストのみの埋め込みモデルを使用してナレッジベースにイメージクエリを指定すると、4xx エラーが返されます。

マルチモーダル API レスポンス構造

マルチモーダルコンテンツの取得レスポンスには、追加のメタデータが含まれます。

  • ソース URI: 元の S3 バケットの場所を指す

  • 補足 URI: マルチモーダルストレージバケット内のコピーを指す

  • タイムスタンプメタデータ: 動画とオーディオのチャンクに含まれ、正確な再生の配置を可能にします

注記

API または SDK を使用する場合は、アプリケーションでファイルの取得とタイムスタンプナビゲーションを処理する必要があります。コンソールは、拡張ビデオ再生と自動タイムスタンプナビゲーションを使用してこれを自動的に処理します。

注記

レスポンスの生成中にプロンプトが文字制限を超えたというエラーが表示された場合は、次の方法でプロンプトを短縮できます。