修改 Amazon Bedrock 知識庫的資料來源 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

修改 Amazon Bedrock 知識庫的資料來源

您可以更新知識庫的資料來源,例如變更資料來源組態。

您可以透過下列方式更新資料來源:

  • 從資料來源新增、變更或移除檔案或內容。

  • 變更資料來源組態,或用於在資料擷取期間加密暫時性資料的 KMS 金鑰。如果您變更來源或端點組態詳細資訊,您應該使用必要的存取許可和 Secrets Manager 秘密 (如適用) 來更新或建立新的 IAM 角色。

  • 將資料來源刪除政策設定為「刪除」或「保留」。您可以在刪除知識庫或資料來源資源時,刪除資料來源中轉換為向量嵌入的所有資料。您可以在刪除知識庫或資料來源資源時,保留資料來源中轉換為向量嵌入的所有資料。請注意,如果您刪除知識庫或資料來源資源,則不會刪除向量存放區本身

每次從資料來源新增、修改或移除檔案時,都必須同步資料來源,使其重新編製索引至知識庫。同步是增量的,因此 Amazon Bedrock 只會處理自上次同步以來新增、修改或刪除的文件。開始擷取之前,請檢查您的資料來源是否符合下列條件:

  • 檔案採用支援的格式。如需詳細資訊,請參閱支援文件格式

  • 檔案不超過 AWS 一般參考 中 Amazon Bedrock 端點和配額中指定的擷取任務檔案大小

  • 如果您的資料來源包含中繼資料檔案,請檢查下列條件,以確保中繼資料檔案不會被忽略:

    • 每個 .metadata.json 檔案與其相關聯的來源檔案共用相同的檔案名稱和副檔名。

    • 如果知識庫的向量索引位於 Amazon OpenSearch Serverless 向量存放區中,請檢查向量索引是否已使用 faiss 引擎設定。如果向量索引是使用 nmslib 引擎設定,您必須執行下列其中一項操作:

    • 如果知識庫的向量索引位於 Amazon Aurora 資料庫叢集中,建議您使用自訂中繼資料欄位,將所有中繼資料存放在單一資料欄中,並在此資料欄上建立索引。如果您未提供自訂中繼資料欄位,則必須先檢查索引的資料表是否包含中繼資料檔案中每個中繼資料屬性的資料欄,然後才能開始擷取。如需詳細資訊,請參閱 使用您為知識庫建立的向量存放區的先決條件

若要了解如何更新資料來源,請選擇您偏好方法的索引標籤,然後遵循下列步驟:

Console
更新資料來源
  1. 使用具有 Amazon Bedrock 主控台使用許可的 IAM 身分登入AWS 管理主控台。接著,開啟位於 https://console.aws.amazon.com/bedrock 的 Amazon Bedrock 主控台。

  2. 在左側導覽窗格中選擇知識庫

  3. 選取知識庫的名稱。

  4. 資料來源區段中,選取您要編輯和同步之資料來源旁的選項按鈕。

  5. (選用) 選擇編輯、變更您的組態,然後選取提交。如果您變更來源或端點組態詳細資訊,您應該使用必要的存取許可和 Secrets Manager 秘密 (如適用) 來更新或建立新的 IAM 角色。此外,請注意,無法變更以原始擷取資料為基礎的分塊組態。您必須重新建立資料來源。

    注意

    您無法變更分塊組態。您必須重新建立資料來源。

  6. (選用) 選擇在進階設定中編輯資料來源資料刪除政策:

    針對資料刪除政策設定,您可以選擇下列其中一項:

    • 刪除:刪除知識庫或資料來源資源時,刪除資料來源中轉換為向量嵌入的所有資料。請注意,向量存放區本身不會一併刪除,僅會刪除資料。如果 AWS 帳戶已刪除,則會忽略此旗標。

    • 保留:刪除知識庫或資料來源資源時,保留資料來源中轉換為向量嵌入的所有資料。請注意,如果您刪除知識庫或資料來源資源,則不會刪除向量存放區本身

  7. 選擇同步

  8. 同步完成且狀態變為就緒時,會出現綠色橫幅。

API
更新資料來源
  1. (選用) 使用 Amazon Bedrock 代理人建置時間端點傳送 UpdateDataSource 請求,變更任何組態,並指定您不想變更的相同組態。如果您變更來源或端點組態詳細資訊,您應該使用必要的存取許可和 Secrets Manager 秘密 (如適用) 來更新或建立新的 IAM 角色。

    注意

    您無法變更 chunkingConfiguration。使用現有的 chunkingConfiguration 傳送請求,或重新建立資料來源。

  2. (選用) 變更資料來源的 dataDeletionPolicy。您可以在刪除知識庫或資料來源資源時,DELETE 資料來源中轉換為向量嵌入的所有資料。如果 AWS 帳戶已刪除,則會忽略此旗標。您可以在刪除知識庫或資料來源資源時,RETAIN 資料來源中轉換為向量嵌入的所有資料。請注意,如果您刪除知識庫或資料來源資源,則不會刪除向量存放區本身

  3. 使用 Amazon Bedrock 代理人建置時間端點傳送 StartIngestionJob 請求,指定 dataSourceIdknowledgeBaseId