本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 创建架构映射
<a name="create-schema-mapping"></a>

此过程描述了使用[AWS Entity Resolution 数据匹配服务 控制台](https://console.aws.amazon.com/entityresolution/home)创建架构映射的过程。

有三种方法可以创建架构映射：
+ 使用 “导入**自 AWS Glue” 选项导入**现有输入数据-使用此创建方法使用引导流程从 AWS Glue 表中预填充的列开始定义输入字段。
+ 使用 “**构建自定义架构**” 选项手动定义输入数据-使用此创建方法通过引导流程手动定义输入字段。
+ 使用 “**使用 JSON 编辑器**” 选项手动创建-使用 JSON 编辑器手动创建、使用示例或导入现有输入数据。
**注意**  
此选项不可用 “**唯一 ID**” 和 “**输入” 字段**。

------
#### [ Import from AWS Glue ]

**通过从中导入现有输入数据来创建架构映射 AWS Glue**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**数据准备**” 下，选择 “**架构映射**”。

1. 在**架构映射**页面的右上角，选择**创建架构映射**。

1. 对于**步骤 1：指定架构详细信息**，请执行以下操作：

   1. 在**名称和创建方法**中，输入**架构映射名称**和可选的**描述**。

   1. 在 “**创建方法**” 中，选择 “**从中导入**” AWS Glue。

   1. 选择 **AWS 区域**。

   1. 选择**AWS Glue 数据库**。

   1. 选择**AWS Glue 桌子**。

      要创建新表，请转到 AWS Glue 控制台[https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/)。有关更多信息，请参阅《*AWS Glue 用户指南*》中的[AWS Glue 表格](https://docs.aws.amazon.com/glue/latest/dg/tables-described.html)。

   1. 对于**唯一 ID**，请指定明确引用每行数据的列。  
**Example**  

      例如，**Primary\$1key**、**Row\$1ID** 或 **Record\$1ID**。
**注意**  
“**唯一 ID**” 列为必填字段。**唯一 ID** 必须是单个表中的唯一标识符。但是，在不同的表中，**唯一 ID** 可能有重复的值。如果未指定**唯一 ID**、在同一个源中不是唯一的，或者不同源的属性名称重叠，则在运行匹配的工作流程时会 AWS Entity Resolution 数据匹配服务 拒绝该记录。如果您在基于规则的匹配工作流程中使用此架构映射，则**唯一 ID** 不得超过 38 个字符。

   1. 对于**输入字段**，选择要用于匹配和可选传递的列。

      您最多可以选择 34 列进行匹配和直通。

      1. 在 “**匹配**” 下，选择要用作匹配输入字段的列。

         您最多可以选择 24 列进行匹配。

      1. 如果要指定不**用于匹配的列，请选择 “添加直通**列”。

      1. （可选）在 “**直通**” 下，选择要包含为直通列的列。
**注意**  
运行基于机器学习的匹配工作流程时，请勿在数据中使用以下任何保留名称作为列名：`MatchId`“”、“、”、`MatchRule` `SourceId` “`RecordId`、” 和`TargetId`”。使用这些保留名称中的任何一个都将导致命名冲突和基于 ML 的匹配工作流程失败。

   1. （可选）如果要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于 “**步骤 2：映射输入字**段”，定义要用于匹配和可选传递的输入字段。

   1. 对于要**匹配的输入字段**，对于每个**输入字段**，
      + 指定**属性类型**以对数据进行分类。
      + 指定 **Match 键名称**以启用与匹配工作流程的输入字段比较。默认情况下，某些匹配键名称会自动与特定的属性类型相关联。
      + 如果该输入字段的列值**经过哈希处理**，请选中 “哈希” 复选框；如果该值为明文，则将该复选框留空。
**注意**  
如果您要创建架构映射以与基于 LiveRamp 提供者服务的匹配技术一起使用，则可以：  
将提供商 ID 的**属性类型**指定为 **LiveRamp ID**。
将**姓名**字段的**属性类型**指定为多个字段（例如**名字**、**姓氏**）或一个字段。
将**街道地址**字段的**属性类型**指定为多个字段（例如**街道地址 1**、**街道地址 2**）或一个字段（**完整地址**）。  
如果与地址匹配，则需要邮政编码（**邮政编码**）。
如果您在姓名中包含**电子邮件（电子邮件地址**）或**电话（电话号码**），则这些字段可以与街道地址匹配。
**注意**  
如果您要创建架构映射以与基于 TransUnion 提供者服务的匹配技术一起使用，则可以指定以下任何**属性类型**：  
**全名**、**名字、姓**氏****
**完整地址**、**街道地址 1**、**城市**、**州**、**国家**、**邮政编码**
**Phone number**（电话号码）
**电子邮件地址**
**日期**
**数字标识符**：**IPV4**IPV6****、或 MA **ID**
**注意**  
如果您要创建架构映射以用于基于机器学习的匹配工作流程，则您的数据集必须至少包含以下**属性**类型之一：  
**全名**
**完整地址**
**手机已满**
**电子邮件地址**
**带有**匹配键名称**的**日期为出生**日期**
请勿将其中任何**属性的属性类型**指定为**自定义字符串**。

   1. **（可选）对于**直通输入字段**，添加不匹配的输入字段及其相应的哈希状态。**

      **哈希状态**表示该输入字段的列值是经过哈希处理还是明文。

   1. 选择**下一步**。

1. 对于 “**步骤 3：分组数据**”，如果**姓名**、**地址**和**电话号码**输入字段已分成多个字段，则可以将它们分组。

   此步骤将相关的输入字段连接成一个字段，这样您就可以在匹配的工作流程中将它们作为一个字段进行比较。

   如果您没有任何数据映射到 “**姓名**”、“**地址**” 或 “**电话号码**” 输入字段，则此部分将为空。

   如果您有更多类型的数据，也可以添加更多组。

   1. 如果要对**名称**输入数据进行分组，请执行以下操作：

      在 “**全名**” 中，选择两个或更多要分组的**输入字段**。

      群**组名称**和**匹配键**会自动与数据类型关联。

      您可以更新**群组名称**，使用自定义**匹配键的匹配键**最多可包含 255 个字符，包括字母、数字、下划线 (\$1) 或连字符 (-)。

      选择 “**添加群组**” 以添加另一个群组。
**注意**  
仅支持对**全名**进行标准化。  
**如果要标准化**全名**子类型，请将以下子类型分配给**全名**组：名字、**中间**名和**姓氏**。**

   1. 如果要对**地址**输入数据进行分组，请执行以下操作：

      对于**完整地址**，请选择两个或更多要分组的**输入字段**字段。

      群**组名称**和**匹配键**。自动与数据类型关联。

      您可以更新**群组名称**，使用自定义**匹配键的匹配键**最多可包含 255 个字符，包括字母、数字、下划线 (\$1) 或连字符 (-)。

      选择 “**添加群组**” 以添加另一个群组。
**注意**  
仅支持**完整地址**的标准化。  
**如果要标准化**完整地址**子类型，请将以下子类型分配给**完整地址组：街道地址 1、街道地址** **2：街****道地址** **3 名称、**城市名称****、**州**、**国家/地区**和邮政编码。**

   1. 如果要对**电话**输入数据进行分组，请执行以下操作：

      对于 **Full phone**，请选择两个或更多要分组的**输入字段**字段。

      群**组名称**和**匹配键**。自动与数据类型关联。

      您可以更新**群组名称**，使用自定义**匹配键的匹配键**最多可包含 255 个字符，包括字母、数字、下划线 (\$1) 或连字符 (-)。

      选择 “**添加群组**” 以添加另一个群组。
**注意**  
只有**完整版手机**支持标准化。  
**如果要标准化**完整电话**子类型，请将以下子类型分配给**完整电话组：电话号码和电话**国家/ **地区代码**。**

   1. 选择**下一步**。

1. 对于 “**步骤 4：查看并创建**”，请执行以下操作：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择 “**创建架构映射”**。
**注意**  
将架构映射与工作流程关联后，您无法对其进行修改。如果要使用现有配置来创建新的架构映射，则可以克隆架构映射。

创建架构映射后，就可以[创建匹配的工作流程](create-matching-workflow.md)或创[建 ID 命名空间](id-namespace.md)了。

------
#### [ Build custom schema ]

**使用 “**构建自定义架构” 选项创建架构**映射**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**数据准备**” 下，选择 “**架构映射**”。

1. 在**架构映射**页面的右上角，选择**创建架构映射**。

1. 对于**步骤 1：指定架构详细信息**，请执行以下操作：

   1. 在名称和创建方法中，输入**架构映射名称**和可选的**描述**。

   1. 在 “**创建方法**” 中，选择 “**生成自定义架构”**。

   1. 在 “**唯一 ID**” 中，输入唯一的 ID 以识别您的每一行数据。  
**Example**  

      例如，**Primary\$1key**、**Row\$1ID** 或 **Record\$1ID**。
**注意**  
“**唯一 ID**” 列为必填字段。**唯一 ID** 必须是单个表中的唯一标识符。但是，在不同的表中，**唯一 ID** 可能有重复的值。如果未指定**唯一 ID**、在同一个源中不是唯一的，或者不同源的属性名称重叠，则在运行匹配的工作流程时会 AWS Entity Resolution 数据匹配服务 拒绝该记录。如果您在基于规则的匹配工作流程中使用此架构映射，则**唯一 ID** 不得超过 38 个字符。

   1. （可选）如果要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于 “**步骤 2：映射输入字**段”，定义要用于匹配和可选传递的输入字段。

   您最多可以为匹配和传递定义总共 34 列。

   1. 对于要**匹配的输入字段**，请输入**输入字段**。
**注意**  
运行基于机器学习的匹配工作流程时，请勿在数据中使用以下任何保留名称作为列名：`MatchId`“”、“、”、`MatchRule` `SourceId` “`RecordId`、” 和`TargetId`”。使用这些保留名称中的任何一个都将导致命名冲突和基于 ML 的匹配工作流程失败。

   1. 选择**属性类型**对数据进行分类。
**注意**  
**如果您要创建架构映射以用于[基于LiveRamp 提供商服务的匹配技术](create-matching-workflow-provider.md#create-mw-liveramp)，则可以将 ProviderID **属性类型指定为** ID。LiveRamp **如果要在输出中包含 PII 数据，则必须将**属性类型**指定为**自定义字符串**。
**注意**  
如果您要创建架构映射以与基于 TransUnion 提供者服务的匹配技术一起使用，则可以指定以下任何**属性类型**：  
**全名**、**名字、姓**氏****
**完整地址**、**街道地址 1**、**城市**、**州**、**国家**、**邮政编码**
**Phone number**（电话号码）
**电子邮件地址**
**日期**
**数字标识符**：**IPV4**IPV6****、或 MA **ID**
**注意**  
如果您要创建架构映射以用于[基于机器学习的匹配工作流程](create-matching-workflow-ml.md)，则您的数据集必须至少包含以下**属性**类型之一：  
**全名**
**完整地址**
**手机已满**
**电子邮件地址**
**带有**匹配键名称**的**日期为出生**日期**
请勿将其中任何**属性的属性类型**指定为**自定义字符串**。

   1. 选择 **Match 键名称**以启用与匹配工作流程的输入字段比较。

      默认情况下，某些匹配键名称会自动与特定的属性类型相关联。

   1. 如果该输入字段的列值**经过哈希处理**，请选中 “哈希” 复选框；如果该值为明文，则将该复选框留空。

   1. 选择 “**添加输入字段”** 以添加更多输入字段。

      您最多可以添加 24 个输入字段进行匹配。

   1. （可选）对于**直通输入字段**，添加不匹配的输入字段及其相应的**哈希状态**。

   1. 选择**下一步**。

1. 对于 “**步骤 3：分组数据**”，如果**姓名**、**地址**、**电话号码**输入字段已分成多个字段，则可以将它们分组。

   此步骤将相关的输入字段连接成一个字段，这样您就可以在匹配的工作流程中将它们作为一个字段进行比较。

   如果您没有任何数据映射到 “**姓名**”、“**地址**”、“**电话号码**” 输入字段，则此部分将为空。

   如果您有更多类型的数据，也可以添加更多组。

   1. 如果要对**名称**输入数据进行分组，请执行以下操作：

      在 “**全名**” 中，选择两个或更多要分组的**输入字段**。

      群**组名称**和**匹配键**会自动与数据类型关联。

      您可以更新**群组名称**，使用自定义**匹配键的匹配键**最多可包含 255 个字符，包括字母、数字、下划线 (\$1) 或连字符 (-)。

      选择 “**添加群组**” 以添加另一个群组。
**注意**  
仅支持对**全名**进行标准化。  
**如果要标准化**全名**子类型，请将以下子类型分配给**全名**组：名字、**中间**名和**姓氏**。**

   1. 如果要对**地址**输入数据进行分组，请执行以下操作：

      对于**完整地址**，请选择两个或更多要分组的**输入字段**字段。

      群**组名称**和**匹配键**。自动与数据类型关联。

      您可以更新**群组名称**，使用自定义**匹配键的匹配键**最多可包含 255 个字符，包括字母、数字、下划线 (\$1) 或连字符 (-)。

      选择 “**添加群组**” 以添加另一个群组。
**注意**  
仅支持**完整地址**的标准化。  
**如果要标准化**完整地址**子类型，请将以下子类型分配给**完整地址组：街道地址 1、街道地址** **2：街****道地址** **3 名称、**城市名称****、**州**、**国家/地区**和邮政编码。**

   1. 如果要对**电话**输入数据进行分组，请执行以下操作：

      对于 **Full phone**，请选择两个或更多要分组的**输入字段**字段。

      群**组名称**和**匹配键**。自动与数据类型关联。

      您可以更新**群组名称**，使用自定义**匹配键的匹配键**最多可包含 255 个字符，包括字母、数字、下划线 (\$1) 或连字符 (-)。

      选择 “**添加群组**” 以添加另一个群组。
**注意**  
只有**完整版手机**支持标准化。  
**如果要标准化**完整电话**子类型，请将以下子类型分配给**完整电话组：电话号码和电话**国家/ **地区代码**。**

   1. 选择**下一步**。

1. 对于 “**步骤 4：查看并创建**”，请执行以下操作：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择 “**创建架构映射”**。
**注意**  
将架构映射与工作流程关联后，您无法对其进行修改。如果要使用现有配置来创建新的架构映射，则可以克隆架构映射。

创建架构映射后，就可以[创建匹配的工作流程](create-matching-workflow.md)或创[建 ID 命名空间](id-namespace.md)了。

------
#### [ Use JSON editor ]

**使用 JSON 编辑器创建架构映射**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**数据准备**” 下，选择 “**架构映射**”。

1. 在**架构映射**页面的右上角，选择**创建架构映射**。

1. 对于**步骤 1：指定架构详细信息**，请执行以下操作：

   1. 在名称和创建方法中，输入**架构映射名称**和可选的**描述**。

   1. 在 “**创建方法**” 中，选择 “**使用 JSON 编辑器**”。

   1. （可选）如果要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：指定映射**：

   1. 开始在 JSON 编辑器中构建架构，或者根据您的目标选择以下选项之一：    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-schema-mapping.html)
**注意**  
仅以下**类型**支持标准化：`NAME`、`ADDRESS``PHONE`、和`EMAIL_ADRESS`。  
如果要对子类型进行标准化处理，请将以下`NAME`子类型分配给 `NAME` **grou** pName：、和 `NAME_FIRST` `NAME_MIDDLE` `NAME_LAST`  
如果要对子类型进行标准化处理，请将以下`ADDRESS`子类型分配给 `ADDRESS` **groupName**`ADDRESS_STREET1`：`ADDRESS_STREET2`、、、、、、`ADDRESS_STREET3`和。`ADDRESS_CITY` `ADDRESS_STATE` `ADDRESS_COUNTRY` `ADDRESS_POSTALCODE`  
**如果要对子类型进行标准化处理，请将以下`PHONE`子类型分配给 groupName：和。`PHONE`** `PHONE_NUMBER` `PHONE_COUNTRYCODE`

   1. 选择**下一步**。

1. 对于**步骤 3：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择 “**创建架构映射”**。
**注意**  
将架构映射与工作流程关联后，您无法对其进行修改。如果要使用现有配置来创建新的架构映射，则可以克隆架构映射。

创建架构映射后，就可以[创建匹配的工作流程](create-matching-workflow.md)或创[建 ID 命名空间](id-namespace.md)了。

------