数据访问集成 - Amazon Quick Suite

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据访问集成

Amazon Quick Suite 中的数据访问集成可建立与外部数据源的安全连接。它们是创建知识库的基础。与执行操作的操作连接器不同,数据访问集成侧重于访问和索引来自第三方应用程序和服务的内容。

数据访问集成仅配置身份验证并指向服务的项目或组织。它们不能直接用于分析,也不能由 AI 代理使用。您必须创建互联知识库才能访问数据。

数据访问集成的工作原理

数据访问集成可配置身份验证并建立与第三方服务组织或项目的连接。您不能直接使用这些集成进行分析。您必须创建与数据访问集成相关的知识库,以便 AI 代理、聊天界面和空间可以访问数据。

数据访问集成和知识库之间的关系是: one-to-many

  • 一个数据访问集成可以支持多个知识库。

  • 每个知识库都从连接的数据源中选择特定的内容。

  • 知识库从其父数据访问集成中继承身份验证和访问权限。

创建数据访问集成

使用以下步骤创建数据访问集成,该集成为知识库创建建立身份验证和连接详细信息。以下示例演示了设置 Microsoft OneDrive 数据访问集成的过程,但一般步骤适用于其他数据访问集成。

创建数据访问集成
  1. 滚动到页面的 “设置新的集成” 区域。找到要创建集成和知识库的应用程序。选择 “OneDrive”。

    注意

    “集成” 页面默认为 “知识库” 选项卡,可能存在由其他人设置并共享的现有知识库。如果您之前设置过集成,请检查数据选项卡,然后使用操作菜单从那里创建知识库。

  2. 选择应用程序上的加号 (+) 图标按钮以创建新的集成和知识库。

  3. 选择 “从 Microsoft 获取数据” OneDrive 选项,然后单击 “下一步” 按钮。

    注意

    一些应用程序集成支持数据摄取和操作。 read/write 每种设置各不相同。要设置操作,您需要管理员提供更多信息。

  4. 完成身份验证过程:

    1. 微软 OneDrive 登录弹出窗口将自动出现。如果不是,请单击 “登录微软 OneDrive ” 按钮。

    2. 使用您的 Amazon 凭证登录。

    3. 等待,直到成功横幅出现。

    4. 单击 “下一步” 按钮。

  5. 使用文件选择器选择应提取到知识库中的数据, OneDrive 然后单击 “添加” 按钮。

  6. 在知识库中键入名称和描述(可选),然后单击 “创建”。

  7. 将收到成功的 toast 通知,数据摄取和同步将开始。

  8. 数据可能需要几分钟才能同步,具体取决于正在摄取的文件数量。“状态” 列将保持同步状态,直到准备就绪,更改为 “可用”。

  9. 知识库准备就绪后,使用聊天提问并与之互动。

    注意

    默认情况下,聊天使用您有权访问并代表您设置的 “所有数据和应用程序”。如果您想使用单个知识库聊天,请在聊天数据选择器中选择知识库。

    注意

    您也可以通过导航到空间并添加知识库来将知识库附加到空间。

成功创建后,您的数据访问集成将显示在集成列表中。现在,您可以创建知识库,使用此集成来访问和索引连接的数据源中的内容。

注意

有关每个数据源的详细配置步骤,请参阅支持的集成

支持的数据来源

Amazon Quick Suite 支持与以下应用程序和服务进行数据访问集成。这些集成允许您从外部数据源创建知识库:

  • Amazon S3-使用 AWS 证书访问存储在 S3 存储桶中的文档和文件。

  • Atlassian Confluenc e-使用用户身份验证或服务身份验证为页面、空间和附件编制索引。

  • Google 云端硬盘-使用 OAuth 2.0 身份验证连接到个人云端硬盘和共享云端硬盘。

  • Microsoft OneDrive-使用用户身份验证或服务身份验证访问 OneDrive 企业内容。

  • Microsoft SharePoint-使用 OAuth 2.0 身份验证为 SharePoint 在线和服务器内容编制索引。

  • Web Crawler-使用基本身份验证或 form/SAML 身份验证为来自内部和外部网站的内容编制索引。

每个数据源都支持不同的身份验证方法和内容访问功能。数据访问集成和知识库之间的关系是 one-to-many-一个集成可以支持多个知识库,每个知识库都从连接的数据源中选择特定的内容。

数据源类别

根据内容类型和访问模式,数据访问集成分为以下类别:

云存储和文件系统
  • AWS S3-访问存储在 S3 存储桶中的文档和文件。

  • Google 云端硬盘-索引来自个人云端硬盘和共享云端硬盘

  • 微软 OneDrive ——Connect to fo OneDrive r Business 内容。

内容管理系统
  • Atlassian Confluence-访问页面、空间和附件。

  • Microsoft SharePoint - SharePoint 在线索引和服务器内容。

网页内容
  • Web Crawler-索引来自内部和外部网站的内容。

身份验证和安全

数据访问集成使用安全的身份验证方法来保护您的数据并维护访问控制。身份验证方法取决于特定的数据源和组织的安全要求。

OAuth 身份验证

大多数基于云的集成(谷歌云端硬盘 OneDrive、Confluence Cloud)都使用 OAuth 2.0 进行基于令牌的安全身份验证。此方法允许 Amazon Quick Suite 无需存储您的凭证即可访问您的数据。

服务账号认证

企业集成可以使用服务帐户进行编程访问。这种方法 AWS 在 S3 和其他基于基础架构的数据源中很常见。

未进行身份验证

某些集成(例如访问公共网站的网络爬虫)可能不需要身份验证。但是,仍会根据您的 Amazon Quick Suite 权限强制执行访问控制。

注意

身份验证要求和可用方法因用户级别而异。与作者相比,读者的身份验证选项可能有限。

访问控制和权限

数据访问集成通过在多个级别实施访问控制来维护安全性。当用户通过知识库查询内容时,Amazon Quick Suite 可确保他们只能访问他们有权查看的内容。

  • 源代码级权限-用户必须在源系统(Google 云端硬盘 SharePoint等)中拥有相应的权限。

  • 集成级别权限-对集成本身的访问由 Amazon Quick Suite 权限控制。

  • 知识库权限-各个知识库可以有自己的访问控制。

  • 实体级访问控制-当用户查询内容时,Amazon Quick Suite 会验证每个文档或项目的权限。

主要特性和功能

数据访问集成提供了多种功能来增强您的数据集成体验:

  • 实时同步-当源系统发生变化时,内容会自动更新。

  • 选择性索引-选择要包含在知识库中的特定文件夹、网站或内容类型。

  • 内容类型支持-索引各种文件格式,包括文档、电子表格、演示文稿和网页。

  • 元数据保存-维护重要的元数据,例如创建日期、作者和标签。

  • 自然语言查询-在索引内容中启用 AI 驱动的搜索和问答功能。

开始前的准备工作

在创建数据访问集成之前,请确保满足以下要求:

  • Amazon Quick Suite 权限-创建和管理集成的作者或管理员角色。

  • 源系统访问权限-目标系统中的相应权限(某些集成可能需要管理权限)。

  • 身份验证凭证-目标系统的有效凭据或服务帐户。

  • 网络连接-确保 Amazon Quick Suite 可以访问您的数据源。网络要求因集成类型而异:

    • 知识库-不支持 VPC 连接。数据源必须可通过公共互联网访问。

    • 操作连接器-支持 VPC 内资源服务器的 VPC 连接。但是,身份验证服务器必须保持可公开访问状态。