数据表 - Amazon 快速

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据表

数据表操作使您可以处理表格格式的结构化数据。这些操作允许您在自动化中创建、转换和输出表格数据。

排序表

按列对表格进行排序。用于按升序或降序组织数据。

特性:

  • 数据表(必填):要排序的表变量(例如my_table

  • 要排序的列名(必填):要排序依据的列的名称(例如,“总金额”)

  • 排序顺序(下拉列表):选择 “升序”(最小的在前)或 “降序”(最大在前)-默认:降序

  • 排序表(输出):新排序表的变量名

筛选表

使行与条件相匹配。用于从较大的数据集中提取相关行。

特性:

  • 数据表(必填):要筛选的表变量(例如my_table

  • 筛选表达式(必填):使用列名和运算符的布尔表达式(==、>、<、! =)。将条件与 & (AND) 或 | (OR) 组合使用。使用单引号表示带有空格和文本值的列名(例如,“'团队'=='销售额'和'总金额'>100")

  • 筛选表(输出):筛选后的表的变量名

过滤器示例:

# Column 'amount' is greater than 25 "amount > 25" # Column 'team' equals text 'Sales' "team == 'Sales'" # Multiple conditions "amount > 25 & status == 'active'" # Grouped conditions "(amount > 25 & team == 'Sales') | (amount > 50 & team == 'Marketing')" # Column 'title' contains text 'Director' "title.str.contains('Director')" # Column 'start_date' is less than '2024-02-02' "start_date < '2024-02-02'"

查询值

在表中搜索一个值。用于在一列中查找值并从同一行的另一列中获取相应的值。

特性:

  • 数据表(必填):要搜索的表(例如my_table

  • 要搜索的列名(必填):包含查询值的列(例如,“员工 ID”)

  • 要搜索的值(必填):要查找的值(例如,“12345”)

  • 要输出的列名(必填):用于检索结果的列(例如,“雇用日期”)

  • 单元格值(输出):存储找到值的变量。返回第一个匹配项,如果未找到则返回空。

添加列

在表中创建新列。新添加的列将追加到现有表的末尾。

特性:

  • 数据表(必填):要修改的表(例如my_table

  • 要添加的列名(必填):新列名的数组(例如,["名称”、“地址"])

  • 默认值(可选):新列中所有单元格的初始值(例如,“N/A”)

  • 更新的表(输出):修改后的表的变量名

移除列

从表中删除列。输出包含所有剩余列的表。

特性:

  • 数据表(必填):要修改的表(例如my_table

  • 要删除的列(必填):列名或索引号的数组。索引号从 0 开始,可以是特定数字(例如 [0,1,2])或范围(例如范围 (0,2))

  • 更新的表(输出):修改后的表的变量名

保留列

从表中删除多余的列。用于选择要保留的特定列子集。

特性:

  • 数据表(必填):要修改的表(例如my_table

  • 要保留的列(必填):要保留的列名数组(例如,["名称”、“地址"])

  • 更新的表(输出):修改后的表的变量名

添加新行

向表中添加新行。新行可以用特定的值创建,也可以创建为空行,并将添加到表的底部。

特性:

  • 数据表(必填):要修改的表(例如my_table

  • 行值(可选):新行的值数组,从第一列开始(例如,["Q1"、“Sales”、100])。如果为空,则添加一个空行。缺少值会导致单元格为空。

  • 更新的表(输出):修改后的表的变量名

移除行

从表中删除行。输出包含所有剩余行的表。

特性:

  • 数据表(必填):要修改的表(例如my_table

  • 要删除的行(必填):行位置数组(基于 0 的索引)。索引号从 0 开始,可以是特定数字(例如 [0,1,2])或范围(例如范围 (0,2))

  • 更新的表(输出):修改后的表的变量名

移除重复项

删除重复的行。用于根据特定列创建由唯一行组成的数据集。

特性:

  • 数据表(必填):要清理的表(例如my_table

  • 要检查的列(可选):用于重复检测的列名数组(例如,["名称”、“地址"])。如果为空,则检查整行的唯一性。重复项由指定列中的组合值来标识。

  • 要保留的重复行(下拉列表):选择要保留的 “第一个” 或 “最后一个” 匹配项(默认:第一个)

  • 更新的表(输出):修改后的表的变量名

追加表

合并两个表的行。用于将数据从一个表添加到另一个表。

特性:

  • 要附加到的表(必填):主表接收其他行(例如)main_table

  • 要添加的表(必填):提供要追加的行的源表(例如)new_data

  • 处理列差异(下拉列表):

    • “添加”:保留两个表中的所有列

    • “忽略”:只保留与主表匹配的列

    • “错误”:需要精确的列匹配

  • 组合表(输出):合并表的变量名

创建新表

创建空表。用于设置包含必填列的表,以便在后续步骤中向其中添加行。新表将没有行。

特性:

  • 列名(可选):新表的列名数组(例如,["名称”、“地址"])。如果为空,则创建一个没有列的表。

  • 新表(输出):新建表的变量名

将文本转换为表格

将分隔的文本转换为结构化表。

特性:

  • 要转换的文本(必填):包含表格数据的分隔文本(例如,“年份,数量 2001,100”)

  • 值分隔符(可选):行中的字符分隔值(默认值:“、”)

  • 换行符分隔符(可选):字符分隔行(默认:"“)

  • 有标题(复选框):第一行是否包含列名。如果为 True,则使用第一行作为标题;如果为 False,则生成默认名称(第 0 列、第 1 列等)

  • 新表(输出):新建表的变量名

将表格转换为 HTML

创建一个 HTML 格式的表格。用于将表格输出为文档、电子邮件等的格式化文本。

特性:

  • 数据表(必填):要格式化的表(例如my_table

  • 格式化表格文本(输出):存储 HTML 格式文本的变量

示例

循环浏览表中的行

要循环浏览数据表中的行,请使用 “流程流” 下的 “循环浏览项目” 操作。提供数据表变量作为 “项目集合” 的输入。将 “项目引用” 更新row为,因为每个项目将代表表格中的一行。

使用或更新行中的单元格值

循环浏览表中的行时,使用将列名替换为特定单元格的列名的语法来引用单个单元格的值。row["column name"]

要更新行中单元格的值,请使用 “常规” 下的 “保存值” 操作。“要保存的值” 将是您要用来更新单元格的值。“变量名” 将使用与上述相同的语法作为对单元格的引用row["column name"]