高级工作流程功能 - Amazon Quick Suite

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

高级工作流程功能

Amazon Quick Sight 的数据准备体验提供了复杂的功能,可增强您创建复杂、可重复使用的数据转换的能力。本节介绍两项可扩展工作流程潜力的强大功能。

Divergence 使您能够从单个步骤创建多个转换路径,从而允许以后可以重新组合的并行处理流。此功能对于诸如自连接和并行转换之类的复杂场景特别有用。

复合数据集允许您使用现有数据集作为构建块来构建分层数据结构。此功能可促进团队之间的协作,并通过可重复使用的分层转换确保一致的业务逻辑。

这些功能共同提供灵活的工作流程设计、增强的团队协作和可重复使用的数据转换。它们可确保清晰的数据沿袭并支持可扩展的数据准备解决方案,使您的组织能够高效、清晰地处理日益复杂的数据场景。

分歧

Divergence 使您能够从工作流程中的单个步骤创建多个并行转换路径。这些路径可以独立转换,然后重新组合,从而实现复杂的数据准备方案,例如自联接。

创建不同的路径

要启动分歧,请在工作流程中执行以下操作:

  1. 选择要在其中创建背离的步骤。

  2. 选择出现的 + 图标。

  3. 配置出现的新分支。

  4. 对每条路径应用所需的变换。

  5. 使用 Join 或 Append 步骤将路径重组为单个输出。

主要特征

  • 从一个步骤中创建多达五条发散路径。

  • 对每条路径应用不同的变换。

  • 使用 “连接” 或 “追加” 步骤重新组合路径。

  • 独立预览每条路径中的更改。

最佳实践

  • 使用差异来实现自联接。

  • 为并行转换创建数据副本。

  • 规划您的重组策略(加入或追加)。

  • 保持清晰的路径命名,以提高工作流程的可见性。

复合数据集

复合数据集使您能够在现有数据集的基础上进行构建,创建可在整个组织中共享和重复使用的分层数据转换结构。在 SPICE 和直接查询模式下,Quick Sight 支持多达 10 个级别的复合数据集。

创建复合数据集

要创建复合数据集,请在工作流程中执行以下操作:

  1. 创建新数据集时选择 “输入” 步骤。

  2. 在 “添加数据” 下选择 “数据” 作为来源。

  3. 选择要构建的现有数据集。

  4. 根据需要应用其他变换。

  5. 另存为新数据集。

主要特征

  • 构建分层数据转换结构。

  • 支持多达 10 个级别的数据集嵌套。

  • 兼容 SPICE 和直接查询。

  • 保持清晰的数据沿袭。

  • 启用特定于团队的变换。

此功能增强了不同团队之间的协作。例如,

角色 操作 Output

全球分析师

使用全球业务逻辑创建数据集

数据集 A

美洲分析师

使用数据集 A,添加区域逻辑

数据集 B

美西分析师

使用数据集 B,添加本地逻辑

数据集 C

这种分层方法通过为转型层分配明确的所有权,在整个组织中促进业务逻辑的一致性。它创建了可追溯的数据谱系,同时支持多达 10 个级别的数据集嵌套,从而实现受控和系统的数据转换管理。

最佳实践

  • 为每个转换层建立明确的所有权。

  • 记录数据集的关系和依赖关系。

  • 根据业务需求规划层次结构深度。

  • 保持一致的命名惯例。

  • 仔细查看和更新上游数据集。