本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将更改直接摄取到知识库中
通过 Amazon Bedrock 知识库,可以在一个步骤中修改数据来源并同步更改。如果知识库已连接到以下类型的数据来源之一,则可利用此功能:
-
Amazon S3
-
自定义
通过直接摄取,您只需一个操作即可直接在知识库中添加、更新或删除文件,知识库无需同步即可访问文档。直接摄取会使用 KnowledgeBaseDocuments API 操作,对您直接提交到为知识库设置的向量存储中的文档编制索引。您还可以通过这些操作直接查看知识库中的文档,而不必导航到连接的数据来源进行查看。
与同步数据来源的区别
Amazon Bedrock 知识库还提供了一组与同步数据来源相关的 IngestionJob API 操作。当您将数据源与StartIngestionJob请求同步时,Amazon Bedrock 知识库会扫描连接的数据源中的每个文档,并验证是否已将其索引到为知识库设置的矢量存储中。如果还没有编入索引,则将其编入向量存储的索引中。
通过IngestKnowledgeBaseDocuments请求,您可以提交一系列文档,以便直接索引到矢量存储中。因此,您可以跳过将文档添加到数据来源中这一步骤。请查看以下几段,了解这两组 API 操作的使用案例:
如果使用自定义数据来源
您无需同步或使用 IngestionJob 操作。通过操作或在KnowledgeBaseDocuments操作中添加、修改或删除的文档将 AWS 管理控制台 成为自定义数据源和知识库的一部分。
如果使用 Amazon S3 数据来源
您可以在不同使用案例中使用这两组操作:
-
首次将知识库连接到 S3 数据源后,您必须通过 Amazon Bedrock API 提交StartIngestionJob请求来同步 AWS 管理控制台 或中的数据源。
-
将文档编入为知识库设置的向量存储的索引中,或者通过以下方式删除已编入索引的文档:
-
将文档添加到 S3 位置或从中删除文档。然后在中同步您的数据源 AWS 管理控制台 或在 API 中提交
StartIngestionJob请求。有关同步和StartIngestionJob操作的详细信息,请参阅将您的数据与 Amazon Bedrock 知识库同步。 -
通过
IngestKnowledgeBaseDocuments请求将 S3 文档直接摄取到知识库中。有关直接摄取文档的详细信息,请参阅将文档直接摄取到知识库中。警告
对于 S3 数据源,您直接在知识库中 AWS 管理控制台 或
KnowledgeBaseDocuments通过 API 操作索引到知识库中的任何更改都不会反映在 S3 位置中。您可以使用这些 API 操作,只需一个步骤即可立即对知识库进行更改。但是,您应该继续在 S3 位置中进行相同的更改,这样下次在 AWS 管理控制台 或中同步数据源时,这些更改就不会被覆盖。StartIngestionJob请勿同时提交
IngestKnowledgeBaseDocuments和StartIngestionJob请求。
-
选择一个主题,了解如何在数据来源中执行文档的直接摄取: