数据结构配方步骤 - AWS Glue DataBrew

数据结构配方步骤

使用这些配方步骤可从不同的角度对数据进行制表和汇总,或者执行高级函数。

SCALE

缩放或标准化数值列中的数据范围。

参数
  • sourceColumn:现有列的名称。

  • strategy:要应用于列值的操作:

    • MIN_MAX:将值重新缩放到 [0,1] 的范围内。

    • SCALE_BETWEEN:将值重新缩放到两个指定值的范围内。

    • MEAN_NORMALIZATION:在 [-1, 1] 的范围内重新缩放数据,使其平均值(μ)为 0,标准差(σ)为 1。

    • Z_SCORE:线性缩放数据值,使其平均值(μ)为 0,标准差(σ)为 1。最适合处理异常值。

  • targetColumn:要包含结果的列的名称。

例 示例

{ "Action": { "Operation": "NORMALIZATION", "Parameters": { "sourceColumn": "all_votes", "strategy": "MIN_MAX", "targetColumn": "all_votes_normalized" } } }