步骤 2:汇总数据 - AWS Glue DataBrew

步骤 2:汇总数据

在此步骤中,您将构建 DataBrew 配方,即一组可以应用于此数据集和其他类似数据集的转换。配方完成后,您可以将其发布以供使用。

在国际象棋比赛中,可以根据玩家与其他玩家的表现对他们进行评级。(有关更多信息,请参阅 https://en.wikipedia.org/wiki/Chess_rating_system)。在本教程中,只关注两位玩家都是 A 级(即他们的评分均为 1800 或更高)的比赛。

汇总数据
  1. 在转换工具栏上,选择筛选按条件大于或等于

  2. 设置如下选项:

    • 源列white_rating

    • 筛选条件:大于或等于 1800

    要查看转换的工作方式,请选择预览更改。然后,选择应用

  3. 重复上一个步骤,但这次将源列设置为 black_rating。应用更改后,样本数据将仅包含双方玩家(黑白)均为 A 级或以上等级的比赛。

  4. 汇总数据以确定每一方赢了多少场比赛。为此,请在转换工具栏上选择

  5. 对于属性,请执行以下操作:

    1. 在第一行中,选择 winner 作为列名。保留聚合分组依据设置。

    2. 在第二行中,选择 victory_status 作为列名。保留聚合分组依据设置。

    3. 选择添加其他列

    4. 在第三行中,选择 winner 作为列名。将聚合设置为计数

    5. 对于组类型,选择分组为新表。预览窗格将显示结果的样子。

    6. 选择完成

  6. 选择发布以保存您的工作(位于配方窗格的右侧)。

  7. 版本描述中,输入我的配方的第一个版本。然后选择发布