本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 Amazon 中使用机器学习和生成人工智能 DataZone
注意
由 Amazon Bedrock 提供支持: AWS 实现自动滥用检测。由于亚马逊中关于描述功能的人工智能建议 DataZone 是建立在 Amazon Bedrock 之上的,因此用户继承了 Amazon Bedrock 中实施的控制措施,以强制执行安全、安保和负责任地使用人工智能。
在当前版本的 Amazon 中 DataZone,您可以使用 AI 的名称和描述推荐功能来自动发现和编目数据。Amazon 对生成式 AI 的支持可为资产和列 DataZone 创建企业名称和描述。您可以使用这些名称和描述为数据添加业务背景,并推荐数据集的分析,这有助于提高数据发现结果。
在 Amazon Bedrock 的大型语言模型的支持下,Amazon 中针对数据资产名称和描述的人工智能建议可 DataZone 帮助您确保您的数据易于理解且易于发现。人工智能建议还提供针对数据集的最相关的分析应用程序。通过减少手动记录任务并就适当的数据使用提出建议,自动生成的名称和描述可以帮助您增强数据的可信度,最大限度地减少对宝贵数据的忽视,从而加快做出明智的决策。
支持的区域
在当前的 Amazon DataZone 版本中,以下区域支持 AI 姓名和描述推荐功能:
-
美国东部(弗吉尼亚州北部)
-
美国西部(俄勒冈)
-
亚太地区(东京)
-
欧洲地区(法兰克福)
-
亚太地区(悉尼)
-
加拿大(中部)
-
欧洲地区(伦敦)
-
南美洲(圣保罗)
-
欧洲地区(爱尔兰)
-
亚太地区(新加坡)
-
美国东部(俄亥俄州)
-
亚太地区(首尔)
Amazon DataZone 支持在以下地区生成企业描述。
-
亚太地区(孟买)
-
欧洲地区(巴黎)
Amazon DataZone 支持在以下地区生成企业名称。
-
欧洲地区(斯德哥尔摩)
基岩跨区域推断
Amazon DataZone 利用 Amazon Bedrock 的跨区域推理终端节点为美国东部(俄亥俄州)地区提供建议。所有其他区域都使用区域内终端节点。
使用 GenAI 的步骤
以下过程介绍如何在 Amazon 中为姓名和描述生成 AI 推荐 DataZone:
-
导航至 Amazon DataZone 数据门户 URL,然后使用单点登录 (SSO) 或您的 AWS 凭证登录。如果您是亚马逊 DataZone管理员,请导航至亚马逊 DataZone 控制台 https://console.aws.amazon.com/datazon
e,使用域名创建 AWS 账户 地登录,然后选择打开数据门户。 -
在顶部导航窗格中,选择选择项目,然后选择包含要为其生成人工智能描述建议的资产的项目。
生成业务描述和摘要
-
导航到项目的数据选项卡。
-
在左侧导航窗格中,选择库存数据,然后选择要为其生成人工智能描述建议的资产的名称。
-
在资产详细信息页面上的业务元数据选项卡中,选择生成描述。
生成公司名称
-
导航到项目的数据选项卡。
-
在左侧导航窗格中,选择数据源,然后选择要为其启用公司名称生成的数据源。
-
前往详细信息选项卡并启用自动生成公司名称配置。
-
BusinessNames 也可以在创建资产时通过启用 API 负载中的 PredictionConfiguration 下的 businessNameGeneration 标志,以编程方式生成。CreateAsset
接受/拒绝预测
-
在生成描述后,您可以编辑、接受或拒绝该描述。
-
每个自动生成的数据资产元数据描述的旁边都会显示绿色图标。在业务元数据选项卡中,您可以选择自动生成的摘要旁边的绿色图标,然后选择编辑、接受或拒绝来处理生成的描述。
-
也可以选择全部接受或全部拒绝选项(在选择业务元数据选项卡时,这两个选项会显示在页面顶部),从而对所有自动生成的描述执行选定操作。
-
或者,您可以选择架构选项卡,然后通过以下方式逐个处理自动生成的描述:一次选择一个列描述的绿色图标,并选择接受或拒绝。
-
在架构选项卡中,也可以选择全部接受或全部拒绝,从而对所有自动生成的描述执行选定操作。
要将资产与生成的描述一起发布到目录,请选择发布资产,然后在发布资产弹出窗口中再次选择发布资产来确认此操作。
注意
如果您未接受或拒绝为某个资产生成的描述,并随后发布该资产,则此未经审核的自动生成的元数据将不会包含在发布的数据资产中。
Support 对自定义关系资产类型的支持
亚马逊 DataZone 支持自定义资产类型的 GenAI 功能。以前,只有托管的 AWS Glue 和 AMazon Redshift 资产类型支持此功能。
要启用此功能,请创建自己的资产类型定义并RelationalTableFormType
作为其中一个表单附上。Amazon DataZone 会自动检测此类表单的存在,并为这些资产启用 GenAI 功能。生成公司名称(通过 CreateAsset API 中的 PredictionConfiguration)和 BusinessDescription(通过生成描述按钮,点击资产详情页面)的总体体验保持不变。
有关创建自定义资产类型的更多信息,请参阅在 Amazon 中创建自定义资产类型 DataZone。
限额
Amazon DataZone 支持不同的企业名称生成和企业描述生成配额。您可以联系 AWS 支持团队以增加这些配额。
-
BusinessDescriptionGeneration: 每月 1 万次调用
-
BusinessNameGeneration: 每月 5 万次调用