将更改直接摄取到知识库中 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将更改直接摄取到知识库中

通过 Amazon Bedrock 知识库,可以在一个步骤中修改数据来源并同步更改。如果知识库已连接到以下类型的数据来源之一,则可利用此功能:

  • Amazon S3

  • 自定义

通过直接摄取,您只需一个操作即可直接在知识库中添加、更新或删除文件,知识库无需同步即可访问文档。直接摄取会使用 KnowledgeBaseDocuments API 操作,对您直接提交到为知识库设置的向量存储中的文档编制索引。您还可以通过这些操作直接查看知识库中的文档,而不必导航到连接的数据来源进行查看。

与同步数据来源的区别

Amazon Bedrock 知识库还提供了一组与同步数据来源相关的 IngestionJob API 操作。如果您使用 StartIngestionJob 同步数据来源,Amazon Bedrock 知识库会扫描连接的数据来源中的每个文档,并验证是否已将其编入为知识库设置的向量存储的索引中。如果还没有编入索引,则将其编入向量存储的索引中。

通过 IngestKnowledgeBaseDocuments 请求,您可以提交一系列文档,直接编入向量存储的索引中。因此,您可以跳过将文档添加到数据来源中这一步骤。请查看以下几段,了解这两组 API 操作的使用案例:

如果使用自定义数据来源

您无需同步或使用 IngestionJob 操作。您通过 KnowledgeBaseDocuments 操作或在 AWS 管理控制台中添加、修改或删除的那些文档,将同时成为自定义数据来源和知识库的一部分。

如果使用 Amazon S3 数据来源

您可以在不同使用案例中使用这两组操作:

  • 首次将知识库连接到 S3 数据来源后,必须在 AWS 管理控制台中同步数据来源,也可以通过 Amazon Bedrock API 提交 StartIngestionJob 请求,来同步数据来源。

  • 将文档编入为知识库设置的向量存储的索引中,或者通过以下方式删除已编入索引的文档:

    1. 将文档添加到 S3 位置或从中删除文档。然后,在 AWS 管理控制台中同步数据来源,或者在 API 中提交 StartIngestionJob 请求。有关同步和 StartIngestionJob 操作的详细信息,请参阅将您的数据与 Amazon Bedrock 知识库同步

    2. 通过 IngestKnowledgeBaseDocuments 请求将 S3 文档直接摄取到知识库中。有关直接摄取文档的详细信息,请参阅将文档直接摄取到知识库中

      警告

      对于 S3 数据来源,您在 AWS 管理控制台中或通过 KnowledgeBaseDocuments API 操作直接编入知识库索引的任何更改,都不会体现在 S3 位置中。您可以使用这些 API 操作,只需一个步骤即可立即对知识库进行更改。但是,您应该在 S3 位置中进行同样的更改以保持同步,这样当您下次在 AWS 管理控制台中或通过 StartIngestionJob 同步数据来源时,这些更改便不会被覆盖。

      请勿同时提交 IngestKnowledgeBaseDocumentsStartIngestionJob 请求。

选择一个主题,了解如何在数据来源中执行文档的直接摄取: