View a markdown version of this page

将更改直接摄取到知识库中 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将更改直接摄取到知识库中

通过 Amazon Bedrock 知识库,可以在一个步骤中修改数据来源并同步更改。如果知识库已连接到以下类型的数据来源之一,则可利用此功能:

  • Amazon S3

  • 自定义

通过直接摄取,您只需一个操作即可直接在知识库中添加、更新或删除文件,知识库无需同步即可访问文档。直接摄取会使用 KnowledgeBaseDocuments API 操作,对您直接提交到为知识库设置的向量存储中的文档编制索引。您还可以通过这些操作直接查看知识库中的文档,而不必导航到连接的数据来源进行查看。

与同步数据来源的区别

Amazon Bedrock 知识库还提供了一组与同步数据来源相关的 IngestionJob API 操作。当您将数据源与StartIngestionJob请求同步时,Amazon Bedrock 知识库会扫描连接的数据源中的每个文档,并验证是否已将其索引到为知识库设置的矢量存储中。如果还没有编入索引,则将其编入向量存储的索引中。

通过IngestKnowledgeBaseDocuments请求,您可以提交一系列文档,以便直接索引到矢量存储中。因此,您可以跳过将文档添加到数据来源中这一步骤。请查看以下几段,了解这两组 API 操作的使用案例:

如果使用自定义数据来源

您无需同步或使用 IngestionJob 操作。通过操作或在KnowledgeBaseDocuments操作中添加、修改或删除的文档将 AWS 管理控制台 成为自定义数据源和知识库的一部分。

如果使用 Amazon S3 数据来源

您可以在不同使用案例中使用这两组操作:

  • 首次将知识库连接到 S3 数据源后,您必须通过 Amazon Bedrock API 提交StartIngestionJob请求来同步 AWS 管理控制台 或中的数据源。

  • 将文档编入为知识库设置的向量存储的索引中,或者通过以下方式删除已编入索引的文档:

    1. 将文档添加到 S3 位置或从中删除文档。然后在中同步您的数据源 AWS 管理控制台 或在 API 中提交StartIngestionJob请求。有关同步和 StartIngestionJob 操作的详细信息,请参阅将您的数据与 Amazon Bedrock 知识库同步

    2. 通过 IngestKnowledgeBaseDocuments 请求将 S3 文档直接摄取到知识库中。有关直接摄取文档的详细信息,请参阅将文档直接摄取到知识库中

      警告

      对于 S3 数据源,您直接在知识库中 AWS 管理控制台 或KnowledgeBaseDocuments通过 API 操作索引到知识库中的任何更改都不会反映在 S3 位置中。您可以使用这些 API 操作,只需一个步骤即可立即对知识库进行更改。但是,您应该继续在 S3 位置中进行相同的更改,这样下次在 AWS 管理控制台 或中同步数据源时,这些更改就不会被覆盖。StartIngestionJob

      请勿同时提交 IngestKnowledgeBaseDocumentsStartIngestionJob 请求。

选择一个主题,了解如何在数据来源中执行文档的直接摄取: