步骤 2:汇总数据
在此步骤中,您将构建 DataBrew 配方,即一组可以应用于此数据集和其他类似数据集的转换。配方完成后,您可以将其发布以供使用。
在国际象棋比赛中,可以根据玩家与其他玩家的表现对他们进行评级。(有关更多信息,请参阅 https://en.wikipedia.org/wiki/Chess_rating_system
汇总数据
-
在转换工具栏上,选择筛选、按条件、大于或等于。
-
设置如下选项:
-
源列:
white_rating -
筛选条件:大于或等于 1800
要查看转换的工作方式,请选择预览更改。然后,选择应用。
-
-
重复上一个步骤,但这次将源列设置为
black_rating。应用更改后,样本数据将仅包含双方玩家(黑白)均为 A 级或以上等级的比赛。 -
汇总数据以确定每一方赢了多少场比赛。为此,请在转换工具栏上选择组。
-
对于组属性,请执行以下操作:
-
在第一行中,选择
winner作为列名。保留聚合的分组依据设置。 -
在第二行中,选择
victory_status作为列名。保留聚合的分组依据设置。 -
选择添加其他列。
-
在第三行中,选择
winner作为列名。将聚合设置为计数。 -
对于组类型,选择分组为新表。预览窗格将显示结果的样子。
-
选择完成。
-
-
选择发布以保存您的工作(位于配方窗格的右侧)。
-
在版本描述中,输入我的配方的第一个版本。然后选择发布。