ナレッジベースをカスタムデータソースに接続する

サポートされているデータソースサービスを選択する代わりに、カスタムデータソースに接続すると、次の利点が得られます。

ナレッジベースからアクセス可能にするデータ型を柔軟に選択して制御できる。
KnowledgeBaseDocuments API オペレーションを使用して、変更を同期せずにドキュメントの取り込みまたは削除を直接実行できる。
Amazon Bedrock コンソールまたは API を使用して、データソース内のドキュメントを直接表示できる。
ドキュメントをのデータソースに直接アップロードAWS マネジメントコンソールしたり、インラインで追加したりできます。
データソース内のドキュメントを追加または更新するときに、メタデータを各ドキュメントに直接追加できる。データソースから情報を取得するときにメタデータを使用してフィルタリングする方法の詳細については、「クエリとレスポンスの生成を設定してカスタマイズする」の「メタデータとフィルタリング」タブを参照してください。

マルチモーダルコンテンツのサポート

カスタムデータソースは、最大 10MB の base64 エンコードされたイメージ、オーディオ、ビデオファイルを含むマルチモーダルコンテンツをサポートします。マルチモーダルコンテンツの使用に関する包括的なガイダンスについては、「」を参照してくださいマルチモーダルコンテンツのナレッジベースを構築する。

ナレッジベースをカスタムデータソースに接続するには、Amazon Bedrock エージェントのビルドタイムエンドポイントを使用して CreateDataSource リクエストを送信します。接続先ナレッジベースの knowledgeBaseId を指定し、データソースに name を指定して、dataSourceConfiguration の type フィールドを CUSTOM として指定します。このデータソースを作成する最小限の例を次に示します。


PUT /knowledgebases/KB12345678/datasources/ HTTP/1.1
Content-type: application/json

{
    "name": "MyCustomDataSource",
    "dataSourceConfiguration": {
        "type": "CUSTOM"
    }
}

次のいずれかのオプションフィールドを含めて、データソースを設定することができます。

フィールド	ユースケース
説明	データソースの説明を入力します。
clientToken	API リクエストが 1 回だけ完了するようにします。詳細については、「べき等性の確保」を参照してください。
serverSideEncryptionConfiguration	データを埋め込みに変換する際の一時データストレージのカスタム KMS キーを指定します。詳細については、データインジェスト時の一時データストレージの暗号化を参照してください。
dataDeletionPolicy	データソースを削除する場合に、ベクトルストア内のデータソースのベクトル埋め込みをどのように処理するかを設定します。ベクトルストア内のデータを保持するには `RETAIN` を指定し、削除するにはデフォルトオプションの `DELETE` を指定します。
vectorIngestionConfiguration	データソースの取り込みのオプションを設定します。詳細については、以下を参照してください。

vectorIngestionConfiguration フィールドは、次のフィールドを含む VectorIngestionConfiguration オブジェクトにマッピングされます。

chunkingConfiguration – データソース内のドキュメントのチャンキングに使用する戦略を設定します。チャンキング戦略の詳細については、「ナレッジベースのコンテンツのチャンキングの仕組み」を参照してください。
parsingConfiguration – データソースの解析に使用する戦略を設定します。解析オプションの詳細については、「データソースの解析オプション」を参照してください。
customTransformationConfiguration – データの変換方法をカスタマイズし、Lambda 関数を適用してさらに詳細なカスタマイズを行います。Lambda 関数を使用してデータのチャンキングとメタデータの処理をカスタマイズする方法の詳細については、「カスタム変換 Lambda 関数を使用してデータの取り込み方法を定義する」を参照してください。

カスタムデータソースを設定したら、カスタムデータソースにドキュメントを追加してナレッジベースに直接取り込むことができます。他のデータソースとは異なり、カスタムデータソースを同期する必要はありません。ドキュメントを直接取り込む方法については、「変更をナレッジベースに直接取り込む」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ウェブクローラー

データソースの取り込みをカスタマイズする