マルチモーダルコンテンツのナレッジベースを作成する

マルチモーダルナレッジベースは、コンソールまたは API を使用して作成できます。マルチモーダル処理のニーズに基づいてアプローチを選択します。

重要

マルチモーダルサポートは、非構造化データソースでナレッジベースを作成する場合にのみ使用できます。構造化データソースは、マルチモーダルコンテンツ処理をサポートしていません。

Console

コンソールからマルチモーダルナレッジベースを作成するには

Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用してにサインインします。Amazon Bedrock コンソール (https://console.aws.amazon.com/bedrock) を開きます。
左側のナビゲーションペインで [ナレッジベース] を選択します。
[ナレッジベース] セクションで [作成] を選択し、[ベクトルストアを含むナレッジベース] を選択します。
(オプション) [ナレッジベースの詳細] で、デフォルトの名前を変更し、ナレッジベースの説明を入力します。
[IAM アクセス許可] で、IAM ロールを選択します。このロールは、他の必要な AWS のサービスにアクセスするためのアクセス許可を Amazon Bedrock に付与します。Amazon Bedrock にサービスロールを作成させるか、独自のカスタムロールを使用することを選択できます。マルチモーダルアクセス許可については、「」を参照してくださいマルチモーダルコンテンツのアクセス許可。
データソースとして Amazon S3 を選択し、次へを選択してデータソースを設定します。

注記
ナレッジベースの作成中に最大 5 つの Amazon S3 データソースを追加できます。ナレッジベースの作成後にデータソースを追加できます。
マルチモーダルコンテンツを含むバケットの S3 URI を指定し、必要に応じて包含プレフィックスを設定します。包含プレフィックスは、取り込むコンテンツを制限するために使用できるフォルダパスです。
チャンキングおよび解析設定で、解析戦略を選択します。
- Bedrock デフォルトパーサー: テキストのみのコンテンツ処理に推奨されます。このパーサーは、マルチモーダルファイルを無視しながら、一般的なテキスト形式を処理します。Word、Excel、HTML、Markdown、TXT、CSV ファイルなどのテキストドキュメントをサポートします。
- Bedrock Data Automation (BDA): マルチモーダルコンテンツを検索可能なテキスト表現に変換します。PDFs、画像、オーディオ、ビデオファイルを処理してテキストを抽出し、ビジュアルコンテンツの説明を生成し、オーディオとビデオコンテンツの文字起こしを作成します。
- 基盤モデルパーサー: 複雑なドキュメント構造の高度な解析機能を提供します。PDFs、画像、構造化ドキュメント、テーブル、視覚的に豊富なコンテンツを処理してテキストを抽出し、視覚的要素の説明を生成します。
次へを選択し、埋め込みモデルとマルチモーダル処理アプローチを選択します。
- Amazon Nova マルチモーダル埋め込み V1.0: Amazon Nova 埋め込み V1.0 を選択して、視覚的およびオーディオの直接類似度検索を行います。コンテンツのセグメント化方法を制御するために、オーディオとビデオのチャンク期間 (1～30 秒、デフォルトは 5 秒) を設定します。
  
  注記
  オーディオとビデオのチャンキングパラメータは、データソースレベルではなく、埋め込みモデルレベルで設定されます。非マルチモーダル埋め込みモデルにこの設定を指定すると、検証例外が発生します。オーディオとビデオのチャンク期間 (デフォルト: 5 秒、範囲: 1～30 秒) を設定して、コンテンツのセグメント化方法を制御します。チャンクが短いほど正確なコンテンツの取得が可能になり、チャンクが長いほどセマンティックコンテキストが保持されます。
  
  重要
  Amazon Nova 埋め込み v1.0 では、音声/ビデオデータ内の音声コンテンツの検索のサポートが制限されています。音声をサポートする必要がある場合は、Bedrock Data Automation をパーサーとして使用します。
- BDA を使用したテキスト埋め込み: BDA 処理を使用するときにテキスト埋め込みモデル (Titan Text Embeddings v2 など) を選択します。テキスト埋め込みモデルは、取得をテキストのみのコンテンツに制限しますが、パーサーとして Amazon Bedrock Data Automation または Foundation Model を選択することで、マルチモーダル取得を有効にすることができます。
  
  注記
  Nova マルチモーダル埋め込みで BDA パーサーを使用する場合、Amazon Bedrock ナレッジベースは最初に BDA 解析を行います。この場合、BDA はイメージ、オーディオ、ビデオをテキスト表現に変換するため、埋め込みモデルはイメージ、オーディオ、ビデオのネイティブマルチモーダル埋め込みを生成しません。
Nova マルチモーダル埋め込みを使用する場合は、処理されたファイルが取得のために保存される Amazon S3 バケットを指定して、マルチモーダルストレージの送信先を設定します。ナレッジベースは、簡単にアクセスできるように .bda が作成されたフォルダを持つ単一の Amazon S3 バケットに解析されたイメージを保存します。

ライフサイクルポリシーの推奨事項
Nova マルチモーダル埋め込みを使用する場合、Amazon Bedrock はマルチモーダルストレージの宛先に一時的なデータを保存し、処理の完了後に削除を試みます。適切なクリーンアップを確保するために、一時的なデータパスにライフサイクルポリシーを適用することをお勧めします。詳細な手順については、「Amazon S3 ライフサイクルポリシーによる一時的なデータの管理」を参照してください。
ベクトルデータベースセクションで、ベクトルストアメソッドを選択し、選択した埋め込みモデルに基づいて適切なディメンションを設定します。
Next を選択し、ナレッジベース設定の詳細を確認し、Create knowledge base を選択します。

CLI

を使用してマルチモーダルナレッジベースを作成するには AWS CLI

Nova マルチモーダル埋め込みを使用してナレッジベースを作成します。CreateKnowledgeBase リクエストを送信します。


aws bedrock-agent create-knowledge-base \
--cli-input-json file://kb-nova-mme.json

の内容 kb-nova-mme.json (プレースホルダー値を特定の設定に置き換えます）。


{
    "knowledgeBaseConfiguration": {
        "vectorKnowledgeBaseConfiguration": {
            "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.nova-2-multimodal-embeddings-v1:0",
            "supplementalDataStorageConfiguration": {
                "storageLocations": [
                    {
                        "type": "S3",
                        "s3Location": {
                            "uri": "s3://<multimodal-storage-bucket>/"
                        }
                    }
                ]
            }
        },
        "type": "VECTOR"
    },
    "storageConfiguration": {
        "opensearchServerlessConfiguration": {
            "collectionArn": "arn:aws:aoss:us-east-1:<account-id>:collection/<collection-id>",
            "vectorIndexName": "<index-name>",
            "fieldMapping": {
                "vectorField": "<vector-field>",
                "textField": "<text-field>",
                "metadataField": "<metadata-field>"
            }
        },
        "type": "OPENSEARCH_SERVERLESS"
    },
    "name": "<knowledge-base-name>",
    "description": "Multimodal knowledge base with Nova Multimodal Embeddings"
}

次のプレースホルダーを置き換えます。

<multimodal-storage-bucket> - マルチモーダルファイルを保存するための S3 バケット
<account-id> - AWS アカウント ID
<collection-id> - OpenSearch Serverless コレクション ID
<index-name> - OpenSearch コレクションのベクトルインデックス名 (選択した埋め込みモデルに適したディメンションで設定)
<vector-field> - 埋め込みを保存するためのフィールド名
<text-field> - テキストコンテンツを保存するためのフィールド名
<metadata-field> - メタデータを保存するためのフィールド名

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

前提条件

データソースを追加して取り込む

マルチモーダルコンテンツのナレッジベースを作成する

重要

コンソールからマルチモーダルナレッジベースを作成するには

注記

注記

重要

注記

ライフサイクルポリシーの推奨事項

を使用してマルチモーダルナレッジベースを作成するには AWS CLI