本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建转换蓝图
BDA 支持根据具体要求拆分和重构数据字段。利用此功能,您可以将提取的数据转换为更符合下游系统或分析需求的格式。
在许多情况下,文档可能包含此类字段,即一个字段中合并了多条信息。BDA 支持将这些字段拆分为单独的字段,以便执行数据操作和分析。例如,如果文档包含一个“人名”字段,则可以将其拆分为名字、中间名、姓氏和后缀这四个单独字段。
对于转换任务,可以将提取类型定义为“显式”或“推断”,具体取决于是否需要对值进行标准化。
| 字段 | 说明 | 提取类型 | 类型 |
|---|---|---|---|
|
FIRST_NAME |
名字 |
显式 |
字符串 |
|
MIDDLE_NAME |
中间名或首字母缩写 |
显式 |
字符串 |
|
LAST_NAME |
驾驶员的姓氏 |
显式 |
字符串 |
|
SUFFIX |
后缀,例如 PhD、MSc 等 |
显式 |
字符串 |
另一个例子是可能显示为单个字段的地址块
| 字段 | 说明 | 提取类型 | 类型 |
|---|---|---|---|
|
街道 |
街道地址是什么 |
显式 |
字符串 |
|
城市 |
是哪个城市 |
显式 |
字符串 |
|
州 |
是哪个州? |
显式 |
字符串 |
|
ZipCode |
地址的邮政编码是什么? |
显式 |
字符串 |
您可以将这些字段定义为完全独立的字段,也可以创建“自定义类型”。自定义类型可以重复用于不同字段。在下面的示例中,我们创建了一个自定义类型“NameInfo”,可用于“EmployeeName”和“ManagerName”字段。