关于自动语义增强 - 亚马逊 OpenSearch 服务

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

关于自动语义增强

创建或编辑集合时,您可以配置自动语义扩展,从而简化 Ama OpenSearch zon Service 中的语义搜索实现和功能。语义搜索返回的查询结果不仅包含关键字匹配,还包含用户搜索意图及上下文含义。例如,当用户搜索“如何治疗头痛”时,语义搜索系统可能会返回以下结果:

  • 偏头痛疗法

  • 疼痛管理技术

  • Over-the-counter 止痛药

  • 自然缓解头痛的方法

即使原始查询中没有这些确切短语,系统也能理解其潜在含义。

自动语义增强提供以下优势:

简化实施

无需机器学习(ML)专业知识或复杂集成。

自动化流程

语义增强在数据摄取期间自动进行。

改进搜索相关性

语义增强可提高搜索结果的质量和上下文准确性。

可扩展性

语义增强无需人工干预,即可对大型数据集应用语义搜索。

工作原理

要开始使用自动语义增强功能,您需要创建或编辑集合,并指定数据中哪些字段需要语义搜索功能。确定要进行语义搜索的字段后,当数据进入 OpenSearch 服务时,自动语义丰富过程会自动丰富这些字段。增强的数据为更智能、更具情境感知能力的搜索提供支持。

注意

实施自动语义增强时,请考虑以下因素:

  • 处理开销:增强过程可能会增加摄取期间的处理时间。

  • 存储影响:增强的数据需要额外的存储空间。

  • 语言限制:确认多语言选项是否支持您所需的语言。

无服务器的自动语义增强功能提供以下语言选项。

仅限英语的选项
  • 针对英语内容进行优化

  • 适用于主要处理英文文本的应用程序

多语言选项
  • 支持以下语言:阿拉伯语、孟加拉语、中文、英语、芬兰语、法语、印地语、印尼语、日语、韩语、波斯语、俄语、西班牙语、斯瓦希里语以及泰卢固语

  • 适用于多样化的国际内容或多语言应用场景

为自动语义增强配置权限

创建自动语义增强索引之前,您需要配置所需的权限。本节介绍所需权限及其设置方法。

IAM 策略权限

使用以下 AWS Identity and Access Management (IAM) 策略授予使用自动语义丰富所需的权限:

JSON
{ "Version":"2012-10-17", "Statement": [ { "Sid": "AutomaticSemanticEnrichmentPermissions", "Effect": "Allow", "Action": [ "aoss:CreateIndex", "aoss:GetIndex", "aoss:UpdateIndex", "aoss:DeleteIndex", "aoss:APIAccessAll" ], "Resource": "*" } ] }
密钥权限
  • 这些 aoss:*Index 权限启用索引管理

  • aoss:APIAccessAll权限允许 OpenSearch API 操作

  • 要限制对特定集合的权限,请将 "Resource": "*" 替换为集合的 ARN

配置数据访问权限

要设置用于自动语义增强的索引,您必须拥有适当的数据访问策略,这些策略需授予访问索引、管道和模型集合资源的权限。有关数据访问策略的更多信息,请参阅 Amazon OpenSearch 无服务器的数据访问控制。有关配置数据访问策略的过程,请参阅 创建数据访问策略(控制台)

数据访问权限

[ { "Description": "Create index permission", "Rules": [ { "ResourceType": "index", "Resource": ["index/collection_name/*"], "Permission": [ "aoss:CreateIndex", "aoss:DescribeIndex", "aoss:UpdateIndex", "aoss:DeleteIndex" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create pipeline permission", "Rules": [ { "ResourceType": "collection", "Resource": ["collection/collection_name"], "Permission": [ "aoss:CreateCollectionItems", "aoss:DescribeCollectionItems" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create model permission", "Rules": [ { "ResourceType": "model", "Resource": ["model/collection_name/*"], "Permission": ["aoss:CreateMLResource"] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, ]

网络访问权限

要允许服务 APIs 访问私有集合,您必须配置网络策略,允许在服务 API 和集合之间进行所需的访问。有关网络策略的更多信息,请参阅 Amazon OpenSearch Serverless 的网络访问权限

[ { "Description":"Enable automatic semantic enrichment in a private collection", "Rules":[ { "ResourceType":"collection", "Resource":[ "collection/collection_name" ] } ], "AllowFromPublic":false, "SourceServices":[ "aoss.amazonaws.com" ], } ]
要配置私有集合的网络访问权限
  1. https://console.aws.amazon.com/aos/家中登录 OpenSearch 服务控制台。

  2. 在左侧导航中,选择网络策略。然后,执行以下操作之一:

    • 选择现有策略名称,然后选择编辑

    • 选择创建网络策略,并配置策略详细信息

  3. 访问权限类型区域中,选择私有(推荐),然后选择 AWS 服务私有访问权限

  4. 在搜索字段中,选择服务,然后选择 aoss.amazonaws.com

  5. 在 “资源类型” 区域中,选中 “启用 OpenSearch 终端节点访问权限” 复选框。

  6. 对于搜索集合,或输入特定的前缀词,在搜索字段中选择集合名称。然后输入或选择要与网络策略相关联的集合名称。

  7. 针对新网络策略选择创建,或针对现有网络策略选择更新