GROUP_BY - AWS Glue DataBrew

GROUP_BY

通过按一列或多列对行进行分组,然后对每个组应用聚合函数来汇总数据。

参数
  • sourceColumns:JSON 编码字符串,表示构成每组基础的列的列表。

  • groupByAggFunctions:JSON 编码字符串,表示要应用的聚合函数列表。(如果您不想聚合,请指定 UNAGGREGATED。)

  • useNewDataFrame:如果为 true,来自 GROUP_BY 的结果将在项目会话中可用,从而替换其当前内容。

例 示例

[ { "Action": { "Operation": "GROUP_BY", "Parameters": { "groupByAggFunctionOptions": "[{\"sourceColumnName\":\"all_votes\",\"targetColumnName\":\"all_votes_count\",\"targetColumnDataType\":\"number\",\"functionName\":\"COUNT\"}]", "sourceColumns": "[\"year\",\"state_name\"]", "useNewDataFrame": "true" } } } ]