View a markdown version of this page

创建集合 - 亚马逊 OpenSearch 服务

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建集合

您可以使用控制台或创建无服务器集合。 AWS CLI 这些步骤介绍如何创建搜索集合或时间序列集合。要创建向量搜索集合,请参阅 使用向量搜索集合

在创建收藏之前,请确保您拥有所需的权限。有关更多信息,请参阅 配置集合权限

Amazon OpenSearch Serverless 支持两代集合:

  • NextGen— 最新一代的 OpenSearch Serverless,具有即时自动缩放和缩放到零的功能,可实现成本优化。使用集合组对多个集合进行共享容量管理。通过 “快速创建” 和 “标准创建” 选项提供简化的单页创建流程。

  • Classic — 使用具有每个集合的安全性、网络和加密配置的多步向导。每个集合都是独立配置的。

当您从 “收藏夹” 页面选择 “创建收藏夹” 时,控制台默认会打开NextGen创建表单。您可以随时使用创建表单上的 “无服务器生成” 字段中的 “切换到经典版” 或 “切换” 进行 NextGen链接在各代之间切换。

配置 NextGen 收藏设置

以下步骤是 Express Create 和 Standard Create 方法的通用步骤。

配置 NextGen 收藏设置
  1. 导航到亚马逊 OpenSearch 服务控制台,网址为https://console.aws.amazon.com/aos/home/

  2. 展开左侧导航窗格中的 Serverless(无服务器),然后选择 Collections(集合)。

  3. 选择 Create collection(创建集合)。默认情况下,会显示 NextGen 收藏创建表单。

    提示

    要改为创建经典收藏集,请在 “无服务器生成” 字段中选择 “切换到经典”。

  4. 为集合提供名称和描述。名称必须符合以下标准:

    • 是您的账户所独有的 AWS 区域

    • 只包含小写字母 a-z、数字 0–9 和连字符(-)

    • 包含 3 到 32 个字符

  5. 选择集合类型:

    • Full-text 搜索 — 为内部网络中的应用程序和面向互联网的应用程序提供支持的搜索。所有搜索数据都将存储在热存储中,以确保快速查询响应时间。

    • 向量搜索 – 对简化向量数据管理的矢量嵌入进行语义搜索。为机器学习 (ML) 增强搜索体验和生成式 AI 应用程序提供支持。

    有关更多信息,请参阅 选择集合类型

  6. 选择收藏创建方法:“快速创建” 或 “标准创建”

创建 NextGen 收藏夹(快速创建)

Express Create 允许你使用合理的默认值快速设置 NextGen 收藏集。 OpenSearch Serverless 会根据您提供的集合名称和集合类型自动为您创建所需的集合组、加密、网络和数据访问策略。

注意

您也可以通过以下方式访问 Express Create:

  • 亚马逊 OpenSearch 服务登录页面蓝色信息横幅中的 “快速创建” 按钮

  • 快速入门快速创建卡片上的 Express 创建按钮

两者都直接打开 Express Create 模式,无需导航到完整的创建页面。

在模态中使用 Express Create 时,无需导航到完整的 “创建收藏夹” 表单,即可在几秒钟内创建收藏夹。输入收藏夹名称,选择收藏夹类型(搜索矢量搜索),然后选择创建收藏夹。 OpenSearch Serverless 会自动使用合理的默认设置配置其余设置。

在创建集合之前,您可以展开配置详细信息部分以查看或修改集合群组、 OpenSearch 用户界面设置、加密、网络访问和数据访问等设置。某些设置也可以在创建后进行更改。

使用 Express Create 创建 NextGen 收藏夹
  1. 配置集合名称、描述和类型(请参阅配置 NextGen 收藏设置)后,选择 Express Cre ate 作为集合创建方法。

  2. 查看 S OpenSearch erverless 代表您配置的默认设置表:

    • 集合组-对于首次使用的用户,将根据集合名称自动生成默认集合组名称。您可以通过选择编辑图标来编辑名称。对于返回的用户,将显示选定类型的现有 NextGen集合组。默认情况下会选择一个。您可以从下拉列表中选择任何其他现有的收藏组。

    • OpenSearch 用户界面设置-默认使用现有 OpenSearch 应用程序。应用程序名称和工作区名称在创建后可以编辑。

    • 加密-该集合使用加密 AWS 拥有的密钥。

    • 网络访问-可从公共网络访问馆藏。

    • 数据访问权限 — 自动创建数据访问策略,授予当前 IAM 委托人对集合及其索引的完全访问权限。

  3. 选择 Create collection(创建集合)。

将显示收集状态Creating。等待收集状态变为,Active然后再开始索引数据。这通常需要几分钟时间。

创建 NextGen 收藏夹(标准创建)

Standard Create 让您可以完全控制集合组、加密、网络和数据访问配置。

使用 “标准创建” 创建 NextGen 收藏夹
  1. 按照中的步骤 1—5 进行操作。配置 NextGen 收藏设置

  2. 在 “集合创建方法” 下,选择 “标准创建”。

    表单将展开以显示以下各节中描述的完整配置部分。

配置集合组

选择如何分配收藏组。即使兼容组已经存在,您也可以选择现有的兼容组或创建新的兼容组。

  • 选择现有-从下拉列表中选择兼容的收藏组。该群组必须支持您选择的收藏类型。控制台显示该组的当前容量限制(用于索引和搜索的 min/max OCU)。

  • 新建-创建具有自定义容量限制的新集合组:

    • 集合组名称 — Auto-generated asnextgen-{collection-name}. 您可以编辑此名称。名称被标准化为小写,连字符替换下划线,并被截断为 32 个字符。

    • 最小索引容量(以 OCU 为单位)— 可选。留空,没有最低限度。

    • 最大索引容量(以 OCU 为单位)-默认值为 96。

    • 最小搜索容量(以 OCU 为单位)— 可选。留空,没有最低限度。

    • 最大搜索容量(以 OCU 为单位)-默认值为 96。

配置加密

选择加密选项:

  • 使用 AWS 自有密钥(默认)— Amazon S OpenSearch ervice 无需支付额外费用即可管理加密密钥。

  • 使用客户管理的密钥-从您的账户中选择一个 AWS KMS 密钥。

(可选)选中 “自定义加密设置” 复选框以选择或创建其他 AWS KMS 密钥。

有关加密策略的更多信息,请参阅Amazon OpenSearch 无服务器中的加密

配置网络访问

为您的馆藏配置网络访问权限:

  • 启用或禁用对 OpenSearch终端节点的公共访问

  • (可选)添加 VPC 终端节点规则以限制访问。

配置数据访问策略

选择如何配置数据访问权限:

  • 创建新策略-定义新的数据访问策略:

    • 输入策略名称和可选描述

    • 使用可视化编辑器添加具有委托人和资源权限的语句,或者切换到 JSON 编辑器进行直接策略编辑。

    • 添加委托人:IAM 用户和角色、SAML 用户和群组或用户和群组。

    • 为集合和索引指定资源权限。

  • 添加到现有策略-从下拉列表中选择现有的数据访问策略。

配置其他设置

  • (可选)将标签作为键值对添加到您的集合中。

配置 OpenSearch 用户界面设置

为您的收藏配置 OpenSearch 应用程序和工作区:

  • 选择OpenSearch 应用程序,请选择以下选项之一:

    • 选择现有 OpenSearch 应用程序-从应用程序名称下拉列表中选择现有OpenSearch 应用程序。然后在 “工作区选择” 中,选择 “选择现有工作空间” 或 “创建新工作区”,然后输入名称。

    • 创建新 OpenSearch 应用程序-输入新应用程序的名称。您还必须创建一个新的工作区 — 输入工作空间的名称。

要创建集合,请查看您的配置并选择提交

提交后,收藏进入创建状态。控制台还会根据需要创建收集组(如果是新的)、加密策略、网络策略和数据访问策略。当集合状态更改为 “激活” 时,就可以开始使用了。这通常需要几分钟时间。

创建经典系列

经典集合使用多步向导,具有每个集合的安全性、网络和加密配置。每个集合都是独立配置的。

配置收藏夹设置(经典)

配置基本收藏设置(经典)
  1. 导航到亚马逊 OpenSearch 服务控制台,网址为https://console.aws.amazon.com/aos/home/。在左侧导航窗格中,展开无服务器并选择集合

  2. 选择 Create collection(创建集合)。

    默认情况下,控制台会打开 “创建 NextGen 集合” 表单。

  3. 在 “无服务器生成” 字段中,选择 “切换到经典版”。

    控制台导航到经典收藏创建向导。Serverless生成字段现在显示经典版并附有描述:这是经典集合的创建流程

    提示

    要切换回到 NextGen,请在无服务器生成字段中选择切换到。 NextGen

  4. 提供馆藏的名称描述。名称必须符合以下标准:

    • 是您的账户所独有的 AWS 区域

    • 仅包含小写字母 a—z、数字 0—9 和连字符 (-)

    • 包含 3 到 32 个字符

  5. 选择收藏类型

    • Time series(时间序列):专注于分析机器生成的大量半结构化数据的日志分析部分。至少 24 小时的数据存储在热索引中,其余数据仍保留在温存储中。

    • Full-text 搜索 — 为内部网络中的应用程序和面向互联网的应用程序提供支持的搜索。所有搜索数据都将存储在热存储中,以确保快速查询响应时间。如果您要启用自动语义搜索,请选择此选项。

    • 矢量搜索 — 对矢量嵌入进行语义搜索,可简化矢量数据的管理。支持机器学习(ML)增强搜索体验和生成式人工智能应用程序,例如聊天机器人、个人助理和欺诈检测。

  6. (可选)配置部署选项

    • 备用副本-选择是否启用备用副本以实现高可用性。

    • GPU 加速-对于矢量搜索集合,选择是否启用 GPU 加速。

  7. 选择下一步

配置安全和访问策略(经典)
  1. 加密策略-选择如何加密您的馆藏中的数据:

    • 使用 AWS 自有密钥(默认)— Amazon S OpenSearch ervice 无需支付额外费用即可管理加密密钥。

    • 使用客户管理的密钥-从您的账户中选择一个 AWS KMS 密钥进行加密。

    (可选)如果您的馆藏名称已存在匹配的加密策略,请选择使用现有策略。

  2. 网络访问-配置用户和应用程序访问您的馆藏的方式:

    • 启用或禁用对 OpenSearch端点的访问

    • 启用或禁用对 OpenSearch 仪表板的访问权限

    • 选择公共访问或限制通过 VPC 终端节点进行访问。

  3. 数据访问策略-定义哪些委托人可以访问您的馆藏数据:

    • 创建新策略-使用可视化编辑器或 JSON 编辑器定义新的数据访问策略。添加委托人(IAM 用户、IAM 角色或 SAML 用户和群组)并指定资源权限。

    • 添加到现有策略-从下拉列表中选择现有的数据访问策略。

  4. 选择下一步

配置 OpenSearch UI(经典)

为您的收藏配置 OpenSearch 应用程序和工作区:

  • 选择OpenSearch 应用程序,请选择以下选项之一:

    • 选择现有 OpenSearch 应用程序-从应用程序名称下拉列表中选择现有OpenSearch 应用程序。然后在 “工作区选择” 中,选择 “选择现有工作空间” 或 “创建新工作区”,然后输入名称。

    • 创建新 OpenSearch 应用程序-输入新应用程序的名称。您还必须创建一个新的工作区 — 输入工作空间的名称。

选择下一步

配置其他搜索字段(经典)

您在此页面上看到的选项取决于您要创建的集合类型。

  • 搜索集合-配置自动语义丰富和词汇搜索字段。

  • 时间序列集合-配置时间序列搜索字段。

  • 矢量搜索集合-配置矢量字段,包括字段名称、维度和距离度量。

(可选)配置与您的馆藏类型相关的搜索字段。选择下一步。查看摘要页面上的所有设置,然后选择 “提交” 以创建集合。

提交后,收藏进入创建状态。当状态更改为 “活动” 时,该集合就可以使用了。

配置自动语义增强

创建或编辑集合时,您可以配置自动语义扩展,从而简化 Ama OpenSearch zon Service 中的语义搜索实现和功能。语义搜索返回的查询结果不仅包含关键字匹配,还包含用户搜索意图及上下文含义。有关更多信息,请参阅 无服务器的自动语义丰富

配置自动语义增强
  1. 索引详细信息部分,对于索引名称,请指定一个名称。

  2. 自动语义增强字段部分中,选择添加语义搜索字段

  3. 语义增强的输入字段名称字段中,输入要增强的字段名称。

  4. 数据类型文本。无法更改此设置。

  5. 对于语言,选择英语多语言

  6. 选择添加字段

  7. 完成对集合的可选字段配置后,选择下一步

  8. 查看您的更改,并选择提交以创建集合。

配置时间序列搜索字段

时间序列搜索字段部分中的选项适用于时间序列数据和数据流。有关这些主题的更多信息,请参阅 使用数据流管理 Amazon OpenSearch 服务中的时间序列数据

配置时间序列搜索字段
  1. 时间序列搜索字段部分,选择添加时间序列字段

  2. 对于字段名称,输入一个名称。

  3. 对于数据类型,从列表中选择一种类型。

  4. 选择添加字段

  5. 完成对集合的可选字段配置后,选择下一步

  6. 查看您的更改,并选择提交以创建集合。

配置词法搜索字段

词法搜索旨在寻找搜索查询与已索引的术语或关键词之间的精确匹配。

配置词法搜索字段
  1. 词法搜索字段部分中,选择添加搜索字段

  2. 对于字段名称,输入一个名称。

  3. 对于数据类型,从列表中选择一种类型。

  4. 选择添加字段

  5. 完成对集合的可选字段配置后,选择下一步

  6. 查看您的更改,并选择提交以创建集合。

配置向量搜索字段

注意

Engine属性只能在 Classic 集合中进行配置, NextGen 集合不支持该属性。

配置向量搜索字段
  1. 向量字段部分,选择添加向量字段

  2. 对于字段名称,输入一个名称。

  3. 对于引擎,从列表中选择一种类型。

  4. 输入维度数。

  5. 对于距离指标,从列表中选择一种类型。

  6. 完成对集合的可选字段配置后,选择下一步

  7. 查看您的更改,并选择提交以创建集合。