將知識庫連結到自訂資料來源 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將知識庫連結到自訂資料來源

您可以連結到自訂資料來源以享有下列優點,而不是選擇支援的資料來源服務:

  • 對您希望知識庫能夠存取的資料類型的彈性和控制。

  • 能夠使用 KnowledgeBaseDocuments API 操作直接擷取或刪除文件,而無需同步變更。

  • 能夠直接透過 Amazon Bedrock 主控台或 API 檢視資料來源中的文件。

  • 能夠直接在 中將文件上傳至資料來源,AWS 管理主控台或內嵌新增文件。

  • 在資料來源中新增或更新文件時,可以直接將中繼資料新增至每個文件。如需從資料來源擷取資訊時如何使用中繼資料進行篩選的詳細資訊,請參閱設定和自訂查詢和回應產生中的中繼資料和篩選索引標籤。

多模態內容支援

自訂資料來源支援多模式內容,包括高達 10MB base64 編碼的影像、音訊和影片檔案。如需使用多模態內容的完整指引,請參閱 建立多模態內容的知識庫

若要將知識庫連結到自訂資料來源,請使用 Amazon Bedrock 代理程式建置時期端點傳送 CreateDataSource 請求。指定要連結至其中的知識庫 knowledgeBaseId,將 name 提供給資料來源,並將 dataSourceConfiguration 中的 type 欄位指定為 CUSTOM。以下顯示建立此資料來源的最基本範例:

PUT /knowledgebases/KB12345678/datasources/ HTTP/1.1 Content-type: application/json { "name": "MyCustomDataSource", "dataSourceConfiguration": { "type": "CUSTOM" } }

您可以包含下列任何選用欄位來設定資料來源:

欄位 使用案例
description 提供資料來源的描述。
clientToken 為確保 API 請求,僅完成一次。如需詳細資訊,請參閱確保冪等性
serverSideEncryptionConfiguration 將資料轉換為嵌入時,為暫時性資料儲存指定自訂 KMS 金鑰。如需詳細資訊,請參閱資料擷取期間的暫時性資料儲存加密
dataDeletionPolicy 如果您刪除資料來源,請為向量存放區中的資料來源設定向量嵌入的操作。指定 RETAIN 來保留向量存放區中的資料,或指定 DELETE 的預設選項來刪除這些資料。
vectorIngestionConfiguration 設定資料來源的擷取選項。如需詳細資訊,請參閱下方。

vectorIngestionConfiguration 欄位會對應至包含下列欄位的 VectorIngestionConfiguration 物件:

設定自訂資料來源之後,您可以將文件新增至其中,並直接將其擷取至知識庫。與其他資料來源不同,您不需要同步自訂資料來源。若要了解如何直接擷取文件,請參閱將變更直接擷取到知識庫