マルチモーダルコンテンツのナレッジベースを作成する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

マルチモーダルコンテンツのナレッジベースを作成する

マルチモーダルナレッジベースは、 コンソールまたは API を使用して作成できます。マルチモーダル処理のニーズに基づいてアプローチを選択します。

重要

マルチモーダルサポートは、非構造化データソースでナレッジベースを作成する場合にのみ使用できます。構造化データソースは、マルチモーダルコンテンツ処理をサポートしていません。

Console
コンソールからマルチモーダルナレッジベースを作成するには
  1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用して にサインインします。Amazon Bedrock コンソール (https://console.aws.amazon.com/bedrock) を開きます。

  2. 左側のナビゲーションペインで [ナレッジベース] を選択します。

  3. [ナレッジベース] セクションで [作成] を選択し、[ベクトルストアを含むナレッジベース] を選択します。

  4. (オプション) [ナレッジベースの詳細] で、デフォルトの名前を変更し、ナレッジベースの説明を入力します。

  5. [IAM アクセス許可] で、IAM ロールを選択します。このロールは、他の必要な AWS のサービスにアクセスするためのアクセス許可を Amazon Bedrock に付与します。Amazon Bedrock にサービスロールを作成させるか、独自のカスタムロールを使用することを選択できます。マルチモーダルアクセス許可については、「」を参照してくださいマルチモーダルコンテンツのアクセス許可

  6. データソースとして Amazon S3 を選択し、次 を選択してデータソースを設定します。

    注記

    ナレッジベースの作成中に最大 5 つの Amazon S3 データソースを追加できます。ナレッジベースの作成後にデータソースを追加できます。

  7. マルチモーダルコンテンツを含むバケットの S3 URI を指定し、必要に応じて包含プレフィックスを設定します。包含プレフィックスは、取り込むコンテンツを制限するために使用できるフォルダパスです。

  8. チャンキングと解析の設定で、解析戦略を選択します。

    • Bedrock デフォルトパーサー: テキストのみのコンテンツ処理に推奨されます。このパーサーは、マルチモーダルファイルを無視しながら、一般的なテキスト形式を処理します。Word、Excel、HTML、Markdown、TXT、CSV ファイルなどのテキストドキュメントをサポートします。

    • Bedrock Data Automation (BDA): マルチモーダルコンテンツを検索可能なテキスト表現に変換します。PDFs、画像、オーディオ、ビデオファイルを処理してテキストを抽出し、ビジュアルコンテンツの説明を生成し、オーディオとビデオコンテンツの文字起こしを作成します。

    • 基盤モデルパーサー: 複雑なドキュメント構造の高度な解析機能を提供します。PDFs、画像、構造化ドキュメント、テーブル、視覚的に豊富なコンテンツを処理してテキストを抽出し、視覚的要素の説明を生成します。

  9. Next を選択し、埋め込みモデルとマルチモーダル処理アプローチを選択します。

    • Amazon Nova マルチモーダル埋め込み V1.0: Amazon Nova 埋め込み V1.0 を選択して、視覚的およびオーディオの直接類似度検索を行います。コンテンツのセグメント化方法を制御するために、オーディオとビデオのチャンク期間 (1~30 秒、デフォルトは 5 秒) を設定します。

      注記

      オーディオおよびビデオチャンキングパラメータは、データソースレベルではなく埋め込みモデルレベルで設定されます。非マルチモーダル埋め込みモデルにこの設定を指定すると、検証例外が発生します。コンテンツのセグメント化方法を制御するには、オーディオとビデオのチャンク期間 (デフォルト: 5 秒、範囲: 1~30 秒) を設定します。チャンクが短いほど正確なコンテンツの取得が可能になり、チャンクが長いほどセマンティックコンテキストが保持されます。

      重要

      Amazon Nova 埋め込み v1.0 では、音声/ビデオデータ内の音声コンテンツの検索のサポートが制限されています。音声をサポートする必要がある場合は、Bedrock Data Automation をパーサーとして使用します。

    • BDA を使用したテキスト埋め込み: BDA 処理を使用するときにテキスト埋め込みモデル (Titan Text Embeddings v2 など) を選択します。テキスト埋め込みモデルは、取得をテキストのみのコンテンツに制限しますが、パーサーとして Amazon Bedrock Data Automation または Foundation Model を選択することで、マルチモーダル取得を有効にすることができます。

      注記

      Nova マルチモーダル埋め込みで BDA パーサーを使用する場合、Amazon Bedrock ナレッジベースは最初に BDA 解析を行います。この場合、BDA はイメージ、オーディオ、ビデオをテキスト表現に変換するため、埋め込みモデルはイメージ、オーディオ、ビデオのネイティブマルチモーダル埋め込みを生成しません。

  10. Nova マルチモーダル埋め込みを使用する場合は、処理されたファイルが取得のために保存される Amazon S3 バケットを指定して、マルチモーダルストレージの送信先を設定します。ナレッジベースは、簡単にアクセスできるように .bda が作成されたフォルダを持つ単一の Amazon S3 バケットに解析されたイメージを保存します。

    ライフサイクルポリシーの推奨事項

    Nova マルチモーダル埋め込みを使用する場合、Amazon Bedrock はマルチモーダルストレージの宛先に一時的なデータを保存し、処理の完了後に削除を試みます。適切なクリーンアップを確保するために、一時的なデータパスにライフサイクルポリシーを適用することをお勧めします。詳細な手順については、「Amazon S3 ライフサイクルポリシーによる一時的なデータの管理」を参照してください。

  11. ベクトルデータベースセクションで、ベクトルストアメソッドを選択し、選択した埋め込みモデルに基づいて適切なディメンションを設定します。

  12. Next を選択し、ナレッジベース設定の詳細を確認し、Create knowledge base を選択します。

CLI
を使用してマルチモーダルナレッジベースを作成するにはAWS CLI
  • Nova マルチモーダル埋め込みを使用してナレッジベースを作成します。CreateKnowledgeBase リクエストを送信します。

    aws bedrock-agent create-knowledge-base \ --cli-input-json file://kb-nova-mme.json

    の内容 kb-nova-mme.json (プレースホルダー値を特定の設定に置き換えます)。

    { "knowledgeBaseConfiguration": { "vectorKnowledgeBaseConfiguration": { "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.nova-2-multimodal-embeddings-v1:0", "supplementalDataStorageConfiguration": { "storageLocations": [ { "type": "S3", "s3Location": { "uri": "s3://<multimodal-storage-bucket>/" } } ] } }, "type": "VECTOR" }, "storageConfiguration": { "opensearchServerlessConfiguration": { "collectionArn": "arn:aws:aoss:us-east-1:<account-id>:collection/<collection-id>", "vectorIndexName": "<index-name>", "fieldMapping": { "vectorField": "<vector-field>", "textField": "<text-field>", "metadataField": "<metadata-field>" } }, "type": "OPENSEARCH_SERVERLESS" }, "name": "<knowledge-base-name>", "description": "Multimodal knowledge base with Nova Multimodal Embeddings" }

    次のプレースホルダーを置き換えます。

    • <multimodal-storage-bucket> - マルチモーダルファイルを保存するための S3 バケット

    • <account-id> - AWS アカウント ID

    • <collection-id> - OpenSearch Serverless コレクション ID

    • <index-name> - OpenSearch コレクションのベクトルインデックス名 (選択した埋め込みモデルに適したディメンションで設定)

    • <vector-field> - 埋め込みを保存するためのフィールド名

    • <text-field> - テキストコンテンツを保存するためのフィールド名

    • <metadata-field> - メタデータを保存するためのフィールド名