在 Amazon DataZone 目录中搜索和查看资产 - Amazon DataZone

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon DataZone 目录中搜索和查看资产

Amazon DataZone 提供了一种简化的数据搜索方式。任何有权访问数据门户的亚马逊 DataZone 用户都可以在亚马逊 DataZone 目录中搜索资产,并查看资产名称和分配给他们的元数据。您可以通过查看其详细信息页面来进一步了解资产。

注意

要查看某个资产包含的实际数据,您必须先订阅该资产,使您的订阅请求获得批准并且您获得访问权限。

Amazon DataZone (新域和现有域名)中的搜索包括基于关键字和语义匹配的结果。搜索算法对关键字匹配进行优先排序,然后在语义匹配项后追加关键字匹配项。

语义搜索功能使不同角色和职能的用户能够更有效地发现、访问和利用其组织的数据资产,从而改善决策、协作和整体数据驱动能力。在语义搜索中,除了简单的关键字匹配结果外,关键字输入还会生成基于同义词和含义的搜索结果。例如,在语义搜索中,如果您输入 “flower” 作为搜索输入,则会在搜索结果中返回名称中带有 “玫瑰” 字样的数据资产。如果您输入 “电影” 作为搜索输入,则会在搜索结果中返回名称中带有 “电影” 字样的数据资产。如果您输入 “足球” 作为搜索输入,则可以在搜索结果中返回名称中带有 “足球” 字样的数据资产。

通过关键字搜索,您可以在搜索已订阅资产时输入各种关键字。例如,如果您有一个名为的资产Catalog Sales Data,则只要输入以下任何关键字,它就会返回到搜索结果中:catalog_salesCatalog SalesCatalogSales、或catalogsales

Amazon DataZone 还通过为列名和表名等技术标识符启用精确匹配和部分匹配功能来增强搜索体验。借助这项新功能,您可以将关键字用双引号 (” “) 括起来,从而确保搜索结果与技术名称完全或部分匹配。此功能建立在关键字和语义搜索功能的基础上,使您能够通过概念和相关术语来发现资产。通过为技术标识符增加一层精确度,此增强功能使您能够管理具有复杂技术命名约定的大型数据目录。

在搜索数据时,您可能需要找到特定的技术资产来支持您的用例。借助搜索技术标识符的功能,您可以准确地检索资产,从而节省时间并简化发现过程。例如,诸如 “customer_id” 之类的查询返回具有确切标识符的列或表,而诸如 “sales_” 之类的部分查询可以识别相关的资产,例如sales_summary和sales_data_2024。这种增强功能可确保数据使用者能够高效地找到他们需要的资产,从而提高工作效率。

在目录中搜索资产
  1. 导航至 Amazon DataZone 数据门户 URL,然后使用单点登录 (SSO) 或凭证登录 AWS 。如果您是亚马逊 DataZone 管理员,则可以通过 https://console.aws.amazon.com/datazon e 导航到亚马逊 DataZone 控制台,使用域名创建 AWS 账户 地登录,然后选择打开数据门户。

  2. 您可以在数据门户主页上的搜索栏中键入要查找的资产的名称。

  3. 要浏览命名空间,请选择页面右上角的目录以打开目录。目录提供了一种多维搜索体验,可让您通过搜索数据所有者和术语表术语等条件来查找资产。

  4. 在某个搜索框中输入您的搜索词。运行搜索后,您可以应用各种筛选条件来缩小结果范围。筛选条件包括资产类型、来源账户和资产 AWS 区域 所属账户。

  5. 要查看有关特定资产的详细信息,请选择该资产以打开其详细信息页面。详细信息页面包括以下信息:

    • 资产名称、数据来源(AWS Glue、Amazon Redshift 或 Amazon S3)、类型(表、视图或 S3 对象)、列数和大小。

    • 资产的描述。

    • 当前发布的资产修订、所有者、是否需要审批订阅、命名空间和更新历史记录。

    • 概述选项卡,包括术语表术语和元数据表单。

    • 架构选项卡,显示资产的架构,包括业务和技术列名称、数据类型以及列的业务描述。“架构”选项卡仅对表和视图可见(对 Amazon S3 对象不可见)。

    • 订阅选项卡,包含域的订阅用户列表。

    • 历史记录选项卡,包含资产的过去修订的列表。