將變更直接擷取到知識庫 - Amazon Bedrock

將變更直接擷取到知識庫

Amazon Bedrock 知識庫可讓您修改資料來源,並在一個步驟中同步變更。如果您的知識庫連接到以下其中一種資料來源類型,則可以利用此功能:

  • Amazon S3

  • 自訂

透過直接擷取,您可以在單一動作中直接新增、更新或刪除知識庫中的檔案,而且您的知識庫可以存取文件,而無需同步。直接擷取會使用 KnowledgeBaseDocuments API 操作,為您直接提交到為知識庫設定的向量存放區的文件編製索引。您也可以直接使用這些操作檢視知識庫中的文件,而不需要導覽至連線的資料來源即可檢視。

與同步資料來源的差異

Amazon Bedrock 知識庫也提供一組與同步資料來源相關的 IngestionJob API 操作。當您使用 StartIngestionJob 請求同步資料來源時,Amazon Bedrock 知識庫會掃描連線資料來源中的每個文件,並驗證它是否已編製索引到為知識庫設定的向量存放區中。如果尚未建立索引,則它會成為向量存放區的索引。

使用 IngestKnowledgeBaseDocuments 請求,您可以提交要直接編製索引到向量存放區的文件陣列。因此,您可以略過將文件新增至資料來源的步驟。請參閱以下段落,以了解這兩組 API 操作的使用案例:

如果您使用自訂資料來源

您不需要同步或使用 IngestionJob 操作。您使用 KnowledgeBaseDocuments 操作或在 AWS 管理主控台 中新增、修改或刪除的文件,會成為自訂資料來源和知識庫的一部分。

如果您使用 Amazon S3 資料來源

您可以在不同的使用案例中使用這兩組操作:

  • 第一次將知識庫連線至 S3 資料來源後,您必須在 AWS 管理主控台 中同步資料來源,或透過 Amazon Bedrock API 提交 StartIngestionJob 請求。

  • 將文件索引至為您的知識庫設定的向量存放區,或以下列方式移除索引文件:

    1. 將文件新增至 S3 位置或從中刪除文件。然後,在 AWS 管理主控台 中同步您的資料來源,或在 API 中提交 StartIngestionJob 請求。如需同步和 StartIngestionJob 操作的詳細資訊,請參閱 將您的資料與您的 Amazon Bedrock 知識庫同步

    2. 使用 IngestKnowledgeBaseDocuments 請求直接將 S3 文件擷取至知識庫。如需直接擷取文件的詳細資訊,請參閱 將文件直接擷取至知識庫

      警告

      對於 S3 資料來源,您直接在 AWS 管理主控台 中或使用 KnowledgeBaseDocuments API 操作編製知識庫索引的任何變更都不會反映在 S3 位置中。您可以使用這些 API 操作,在單一步驟中立即變更知識庫。不過,您應該在 S3 位置進行相同的變更,以便下次在 AWS 管理主控台 中或使用 StartIngestionJob 同步資料來源時,不會覆寫這些變更。

      請勿同時提交 IngestKnowledgeBaseDocumentsStartIngestionJob 請求。

選取主題,以了解如何在資料來源中執行直接擷取文件: