知识库 - Amazon Quick Suite

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

知识库

知识库是来自数据源的有组织的索引文档或内容集合,这些文档或内容已针对生成式 AI 驱动的检索和问答进行了优化。无论您的团队在 Confluence 中存储文档 SharePoint、通过协作还是管理云存储中的文件,您都可以通过创建知识库将所有这些信息整合到一个统一的搜索体验中。

只需点击几下即可设置内置集成,即可在 Quick Suite 中同步数据,并轻松利用组织在 Google 云端硬盘、Confluence OneDrive SharePoint、S3 和 Web Crawler 上的知识。无论您的团队将文档存储在 Confluence 中 SharePoint、通过协作还是管理云存储中的文件,您都可以在知识库的帮助下将所有这些信息整合到一个统一的搜索体验中。

知识库的运作方式

知识库是来自 Google 云端硬盘等数据源的文档或内容的索引集合,针对人工智能驱动的生成式检索和问答进行了优化。可以从同一个来源创建多个知识库,并且所有知识库都可以存储在共享的快速索引中。例如,如果您从 Google 云端硬盘同步两个文件夹并创建了两个知识库,一个用于 “政策文档”,用于回答 “我们的退款政策是什么” 之类的问题,另一个用于 “客户反馈”,用于回答 “常见的客户投诉有哪些” 之类的问题,则两者都可以归入同一个索引。使用知识库 ID 快速区分它们,因此可以筛选查询,仅从所需的知识库中检索相关文档。这允许用户组织、保护和检索与不同域名或用例相关的信息,即使基础数据是一起编制索引的。

您的知识库可以单独使用,也可以通过 Amazon Quick Suite 空间与团队成员共享。我们的粗粒度访问控制可实现知识库级别的安全性,确保用户只能从他们有权访问的知识库中接收信息。

创作过程

您可以在设置新的数据访问集成时创建知识库,并使用现有集成来创建其他知识库:

  1. 数据访问集成设置-Connect 连接到您的外部数据源

  2. 内容选择-通过过滤器和范围设置选择要包含的内容

  3. 索引-Amazon Quick Suite 对所选内容进行处理和编制索引

  4. 可用性-知识库可供空间和 AI 代理使用

功能

每个知识库都提供以下功能:

  • 内容索引-处理来自外部来源的文本、文档和结构化数据

  • 语义搜索-支持 AI 驱动的跨索引内容的搜索

  • 自动同步- up-to-date 使用可配置的同步计划保留内容

  • 粗粒度访问控制-确保用户只能从他们有权访问的知识库中接收信息。

  • 多空间使用-可以跨多个空间使用,也可由不同的 AI 代理使用

一般工作流程

使用知识库的典型工作流程遵循以下步骤:

  1. 设置数据源集成-使用适当的身份验证连接到您的外部应用程序(例如 SharePoint Google 云端硬盘或 Confluence)。有关更多信息,请参阅 特定于集成的指南

  2. 创建知识库-您可以在配置新集成时创建知识库。通过设置包含过滤器、文件类型限制和文件夹选择来配置内容过滤器,以专注于相关内容。

  3. 设置同步计划-默认情况下,数据刷新频率设置为每天。您可以编辑同步频率,以配置使用来自源代码的新内容更新知识库的频率。

  4. 监控和管理-查看同步状态,管理访问权限。

常用配置设置

知识库在不同的数据源集成中共享常见的配置模式。了解这些设置可以帮助您优化内容索引并有效地管理同步行为。

注意

虽然这些配置选项适用于大多数集成,但具体设置和可用选项可能会有所不同,具体取决于您选择的数据源集成。

文件大小和内容限制

配置文件大小限制以优化处理性能并管理存储成本。具体限制因内容类型而异,在配置知识库时会显示在控制台中。

标准文本文档

适用于诸如 PDFs Word 文件和文本文件之类的文档。文件大小限制为 50 MB。

视频文件

启用视频处理时可用。支持的格式包括.mp4.mov、。 m4v。视频文件的限制为 10 GB (10240 MB)。

音频文件

启用音频处理时可用。支持的格式包括.mp3 .wav .m4a.flac、和 .ogg。音频文件的限制为 2 GB (2048 MB)。

注意

无论原始文件大小如何,提取的文本超过 30 MB 系统限制的文件都不会编制索引。可以从单个文档中提取的最大文本量为 30 MB。

同步日程安排和安全措施

配置知识库更新频率并防止意外删除内容:

同步频率

默认情况下,数据刷新频率设置为每天。您可以编辑同步频率,以配置知识库应多久更新源中的新内容的频率

文件删除保障

通过设置最大删除百分比阈值,保护您的索引内容免遭意外批量删除。如果同步作业删除的文档数量超出您的阈值允许的范围,则会跳过删除阶段,从而保留您现有的已编入索引的内容。

这种保护措施可以防止临时网络问题、权限更改或源系统问题,这些问题可能会使内容暂时不可用。