本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
高级工作流程功能
Amazon Quick Sight 的数据准备体验提供了复杂的功能,可增强您创建复杂、可重复使用的数据转换的能力。本节介绍两项可扩展工作流程潜力的强大功能。
Divergence 使您能够从单个步骤创建多个转换路径,从而允许以后可以重新组合的并行处理流。此功能对于诸如自连接和并行转换之类的复杂场景特别有用。
复合数据集允许您使用现有数据集作为构建块来构建分层数据结构。此功能可促进团队之间的协作,并通过可重复使用的分层转换确保一致的业务逻辑。
这些功能共同提供灵活的工作流程设计、增强的团队协作和可重复使用的数据转换。它们可确保清晰的数据沿袭并支持可扩展的数据准备解决方案,使您的组织能够高效、清晰地处理日益复杂的数据场景。
分歧
Divergence 使您能够从工作流程中的单个步骤创建多个并行转换路径。这些路径可以独立转换,然后重新组合,从而实现复杂的数据准备方案,例如自联接。
创建不同的路径
要启动分歧,请在工作流程中执行以下操作:
-
选择要在其中创建背离的步骤。
-
选择出现的 + 图标。
-
配置出现的新分支。
-
对每条路径应用所需的变换。
-
使用 Join 或 Append 步骤将路径重组为单个输出。
主要特征
-
从一个步骤中创建多达五条发散路径。
-
对每条路径应用不同的变换。
-
使用 “连接” 或 “追加” 步骤重新组合路径。
-
独立预览每条路径中的更改。
最佳实践
-
使用差异来实现自联接。
-
为并行转换创建数据副本。
-
规划您的重组策略(加入或追加)。
-
保持清晰的路径命名,以提高工作流程的可见性。
复合数据集
复合数据集使您能够在现有数据集的基础上进行构建,创建可在整个组织中共享和重复使用的分层数据转换结构。在 SPICE 和直接查询模式下,Quick Sight 支持多达 10 个级别的复合数据集。
创建复合数据集
要创建复合数据集,请在工作流程中执行以下操作:
-
创建新数据集时选择 “输入” 步骤。
-
在 “添加数据” 下选择 “数据集” 作为来源。
-
选择要构建的现有数据集。
-
根据需要应用其他变换。
-
另存为新数据集。
主要特征
-
构建分层数据转换结构。
-
支持多达 10 个级别的数据集嵌套。
-
兼容 SPICE 和直接查询。
-
保持清晰的数据沿袭。
-
启用特定于团队的变换。
此功能增强了不同团队之间的协作。例如,
| 角色 | 操作 | Output |
|---|---|---|
|
全球分析师 |
使用全球业务逻辑创建数据集 |
数据集 A |
|
美洲分析师 |
使用数据集 A,添加区域逻辑 |
数据集 B |
|
美西分析师 |
使用数据集 B,添加本地逻辑 |
数据集 C |
这种分层方法通过为转型层分配明确的所有权,在整个组织中促进业务逻辑的一致性。它创建了可追溯的数据谱系,同时支持多达 10 个级别的数据集嵌套,从而实现受控和系统的数据转换管理。
最佳实践
-
为每个转换层建立明确的所有权。
-
记录数据集的关系和依赖关系。
-
根据业务需求规划层次结构深度。
-
保持一致的命名惯例。
-
仔细查看和更新上游数据集。