マルチモーダルナレッジベースのトラブルシューティング - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

マルチモーダルナレッジベースのトラブルシューティング

このセクションでは、マルチモーダルナレッジベースを使用する際に発生する一般的な問題を解決するためのガイダンスを提供します。トラブルシューティング情報は、一般的な制限事項、一般的なエラーシナリオとその原因と解決策、パフォーマンス最適化の推奨事項別に整理されています。この情報を使用して、マルチモーダルコンテンツのセットアップ、取り込み、またはクエリ中の問題を診断し、解決します。

一般的な制限事項

マルチモーダルナレッジベースを使用する場合は、以下の現在の制限に注意してください。

  • ファイルサイズ制限: ビデオファイルあたり最大 1.5 GB、オーディオファイルあたり最大 1 GB (Nova マルチモーダル埋め込み)、またはファイルあたり最大 1.5 GB (BDA)

  • 取り込みジョブあたりのファイル: ジョブあたり最大 15,000 ファイル (Nova マルチモーダル埋め込み) またはジョブあたり最大 1,000 ファイル (BDA)

  • クエリ制限: クエリごとに最大 1 つのイメージ

  • データソースの制限: Amazon S3 とカスタムデータソースのみがマルチモーダルコンテンツをサポート

  • BDA チャンキングの制限: 固定サイズのチャンキングで Bedrock Data Automation を使用する場合、オーバーラップ率の設定はオーディオコンテンツとビデオコンテンツには適用されません。

  • BDA 同時ジョブの制限: デフォルトの制限は 20 の同時 BDA ジョブです。大規模な処理の場合は、サービスクォータの引き上げをリクエストすることを検討してください。

  • リランク付けモデルの制限: リランク付けモデルはマルチモーダルコンテンツではサポートされていません

  • 要約の制限: テキスト以外のコンテンツを含む検索レスポンスの要約はサポートされていません

  • クエリ入力の制限: テキストとイメージの両方を含む入力は現在サポートされていません。テキストクエリまたはイメージクエリのいずれかを使用できますが、両方を同時に使用することはできません。

  • ガードレールイメージコンテンツフィルター: イメージコンテンツフィルターが設定されたガードレールでイメージクエリを使用する場合、入力イメージはガードレールに対して評価され、設定されたフィルターしきい値に違反するとブロックされる可能性があります。

  • 入力とタイプの不一致: デフォルトでは、タイプが指定されていない場合、入力はテキストと見なされます。テキスト以外のモダリティを使用する場合は、正しいタイプを指定する必要があります

一般的なエラーと解決策

マルチモーダルナレッジベースで問題が発生した場合は、次の一般的なシナリオを確認してください。

イメージクエリを使用する場合の 4xx エラー

原因: テキストのみの埋め込みモデルまたは BDA 処理されたナレッジベースでイメージクエリを使用しようとする。

解決策: イメージクエリをサポートするナレッジベースを作成するときは、Amazon Nova マルチモーダル埋め込みを選択します。

RAG がマルチモーダルコンテンツで 4xx エラーを返す

原因: マルチモーダルコンテンツと Amazon Nova マルチモーダル埋め込みモデルのみを含むナレッジベースRetrieveAndGenerateで を使用する。

解決策: RAG 機能に BDA パーサーを使用するか、ナレッジベースにテキストコンテンツが含まれていることを確認します。

マルチモーダルストレージの宛先で必要なエラー

原因: マルチモーダルストレージの送信先を設定せずに Nova マルチモーダル埋め込みを使用する。

解決策: Nova マルチモーダル埋め込みを使用する場合は、マルチモーダルストレージの宛先を指定します。

データソースとマルチモーダルストレージが同じ S3 バケットを使用する

原因: データソースとマルチモーダルストレージの送信先を、適切な包含プレフィックスなしで同じ Amazon S3 バケットを使用するように設定します。

解決策: データソースとマルチモーダルストレージに別々のバケットを使用するか、抽出されたメディアファイルを再取り込みしないように包含プレフィックスを設定します。

包含プレフィックスは「aws/」で始めることはできません

原因: データソースとマルチモーダルストレージの宛先が同じ Amazon S3 バケットを共有する場合、「aws/」で始まる包含プレフィックスを使用します。

解決策: 別の包含プレフィックスを指定します。「aws/」パスは抽出されたメディアストレージ用に予約されており、処理されたコンテンツの再取り込みを避けるために包含プレフィックスとして使用することはできません。

BDA 取り込みはマルチモーダルコンテンツをスキップします

原因: ナレッジベースがマルチモーダルストレージの宛先なしで作成され、BDA データソースがマルチモーダルコンテンツで追加されました。

解決策: オーディオ、ビデオ、イメージファイルの BDA 処理を有効にするように設定されたマルチモーダルストレージの送信先を使用してナレッジベースを再作成します。

マルチモーダル埋め込みモデルなしで作成されたナレッジベース

原因: ナレッジベースはテキストのみの埋め込みモデルで作成され、マルチモーダル機能が制限されました。

解決策: Nova マルチモーダル埋め込みを使用して新しいナレッジベースを作成し、ネイティブのマルチモーダル処理と画像ベースのクエリを有効にします。

Amazon S3 ライフサイクルポリシーによる一時的なデータの管理

Nova マルチモーダル埋め込みを使用する場合、Amazon Bedrock はマルチモーダルストレージの宛先に一時的なデータを保存し、処理の完了後に削除を試みます。一時的なデータパスにライフサイクルポリシーを適用して、適切に期限切れであることを確認することをお勧めします。

Console
コンソールを使用してライフサイクルルールを作成するには
  1. Amazon S3 コンソールを開きます。

  2. ナレッジベース用に設定したマルチモーダルストレージの宛先に移動します。

  3. 管理タブを選択し、ライフサイクルルールの作成を選択します。

  4. ライフサイクルルール名には、 と入力しますTransient Data Deletion

  5. フィルタータイプで、1 つ以上のフィルターを使用してこのルールの範囲を制限するを選択します。

  6. プレフィックス には、ナレッジベースとデータソースの一時的なデータパスを入力します。

    次のプレフィックスのプレースホルダー値を実際の識別子に置き換えます。

    aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data
    重要

    ライフサイクルポリシーをバケット全体または「aws/」プレフィックスに適用しないでください。マルチモーダルコンテンツが削除され、取得が失敗します。上記の特定の一時データパスのみを使用してください。

  7. ライフサイクルルールアクションで、オブジェクトの最新バージョンを期限切れにするを選択します。

  8. オブジェクト作成後の日数には、 と入力します1

  9. [‬ルールを作成]‭ を選択します。

AWS CLI
を使用してライフサイクルルールを作成するにはAWS CLI
  1. 次の内容lifecycle-policy.jsonで という名前の JSON ファイルを作成します。

    プレースホルダーの値を実際の識別子に置き換えます。

    • knowledge-base-id - ナレッジベース識別子

    • data-source-id - データソース識別子

    { "Rules": [ { "ID": "TransientDataDeletion", "Status": "Enabled", "Filter": { "Prefix": "aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data" }, "Expiration": { "Days": 1 } } ] }
  2. ライフサイクルポリシーをバケットに適用します。your-multimodal-storage-bucket を実際のバケット名に置き換えます。

    aws s3api put-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket \ --lifecycle-configuration file://lifecycle-policy.json
  3. ライフサイクルポリシーが適用されていることを確認します。

    aws s3api get-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket

Amazon S3 ライフサイクルポリシーの詳細については、「Amazon Amazon S3ユーザーガイド」の「オブジェクトのライフサイクルの管理」を参照してください。

パフォーマンスに関する考慮事項

マルチモーダルナレッジベースで最適なパフォーマンスを得るには、次の要素を考慮してください。

  • 処理時間: コンテンツ変換により BDA 処理に時間がかかる

  • クエリレイテンシー: イメージクエリはテキストクエリよりもレイテンシーが高くなる可能性があります

  • チャンキング時間: オーディオ/ビデオチャンク時間が長いほど処理時間が長くなりますが、精度が向上する可能性があります