本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将更改直接摄取到知识库中
通过 Amazon Bedrock 知识库,可以在一个步骤中修改数据来源并同步更改。如果知识库已连接到以下类型的数据来源之一,则可利用此功能:
-
Amazon S3
-
自定义
通过直接摄取,您只需一个操作即可直接在知识库中添加、更新或删除文件,知识库无需同步即可访问文档。直接摄取会使用 KnowledgeBaseDocuments API 操作,对您直接提交到为知识库设置的向量存储中的文档编制索引。您还可以通过这些操作直接查看知识库中的文档,而不必导航到连接的数据来源进行查看。
与同步数据来源的区别
Amazon Bedrock 知识库还提供了一组与同步数据来源相关的 IngestionJob API 操作。如果您使用 StartIngestionJob 同步数据来源,Amazon Bedrock 知识库会扫描连接的数据来源中的每个文档,并验证是否已将其编入为知识库设置的向量存储的索引中。如果还没有编入索引,则将其编入向量存储的索引中。
通过 IngestKnowledgeBaseDocuments 请求,您可以提交一系列文档,直接编入向量存储的索引中。因此,您可以跳过将文档添加到数据来源中这一步骤。请查看以下几段,了解这两组 API 操作的使用案例:
如果使用自定义数据来源
您无需同步或使用 IngestionJob 操作。您通过 KnowledgeBaseDocuments 操作或在 AWS 管理控制台中添加、修改或删除的那些文档,将同时成为自定义数据来源和知识库的一部分。
如果使用 Amazon S3 数据来源
您可以在不同使用案例中使用这两组操作:
-
首次将知识库连接到 S3 数据来源后,必须在 AWS 管理控制台中同步数据来源,也可以通过 Amazon Bedrock API 提交 StartIngestionJob 请求,来同步数据来源。
-
将文档编入为知识库设置的向量存储的索引中,或者通过以下方式删除已编入索引的文档:
-
将文档添加到 S3 位置或从中删除文档。然后,在 AWS 管理控制台中同步数据来源,或者在 API 中提交
StartIngestionJob请求。有关同步和StartIngestionJob操作的详细信息,请参阅将您的数据与 Amazon Bedrock 知识库同步。 -
通过
IngestKnowledgeBaseDocuments请求将 S3 文档直接摄取到知识库中。有关直接摄取文档的详细信息,请参阅将文档直接摄取到知识库中。警告
对于 S3 数据来源,您在 AWS 管理控制台中或通过
KnowledgeBaseDocumentsAPI 操作直接编入知识库索引的任何更改,都不会体现在 S3 位置中。您可以使用这些 API 操作,只需一个步骤即可立即对知识库进行更改。但是,您应该在 S3 位置中进行同样的更改以保持同步,这样当您下次在 AWS 管理控制台中或通过StartIngestionJob同步数据来源时,这些更改便不会被覆盖。请勿同时提交
IngestKnowledgeBaseDocuments和StartIngestionJob请求。
-
选择一个主题,了解如何在数据来源中执行文档的直接摄取: