本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
为基于规则的匹配工作流程修改或生成匹配 ID
匹配 ID 是在运行匹配工作流程后,由每个匹配的记录集生成 AWS Entity Resolution 数据匹配服务 并应用于这些记录集的标识符。这是输出中包含的匹配工作流程元数据的一部分。
当您需要更新现有客户的记录或向数据集中添加新客户时,可以使用 AWS Entity Resolution 数据匹配服务 控制台或 GenerateMatchID
API。修改现有的匹配 ID 有助于在更新客户信息时保持一致性,而在向系统中添加以前未识别的客户时,则需要生成新的匹配 ID。
注意
无论您使用控制台还是 API,都需要支付额外费用。您选择的处理类型会影响操作的准确性和响应时间。
重要
如果您在任务进行期间撤消了对 S3 存储桶的 AWS Entity Resolution 数据匹配服务 权限,则仍 AWS Entity Resolution 数据匹配服务 会处理向 S3 输出结果并收取费用,但无法将结果传送到您的存储桶。为避免出现此问题,请确保在开始任务之前 AWS Entity Resolution 数据匹配服务 具有写入您的 S3 存储桶的正确权限。如果在处理过程中权限被撤销,则在您恢复正确的存储桶权限后,会在任务完成后最长 30 天内 AWS Entity Resolution 数据匹配服务 尝试重新交付结果。
以下步骤将指导您完成查找或生成匹配 ID、选择处理类型以及查看结果的过程。
- Console
-
使用控制台修改或生成匹配 ID
-
登录 AWS Management Console 并打开 AWS Entity Resolution 数据匹配服务 控制台,网址为https://console.aws.amazon.com/entityresolution/
。 -
在左侧导航窗格的 “工作流程” 下,选择 “匹配”。
-
选择已处理的基于规则的匹配工作流(Job 状态为 “已完成”)。
-
在匹配的工作流程详细信息页面上,选择匹配 IDs选项卡。
-
选择 “修改” 或 “生成匹配 ID”。
注意
“修改或生成匹配 ID” 选项仅适用于使用自动处理节奏的匹配工作流程。如果您选择了手动处理节奏,则此选项将显示为非活动状态。要使用此选项,请编辑您的工作流程以使用自动处理节奏。有关编辑工作流程的更多信息,请参阅编辑匹配的工作流程。
-
从下拉列表中选择表。AWS Glue
如果工作流程中只有一个 AWS Glue 表,则默认情况下会将其选中。
-
选择处理类型。
-
一致 — 您可以查找现有的匹配 ID 或立即生成并保存新的匹配 ID。此选项具有最高的精度和较慢的响应时间。
-
背景(如API
EVENTUAL
所示)— 您可以查找现有的匹配ID或立即生成新的匹配ID。更新的记录保存在后台。此选项具有快速的初始响应,以后将在 S3 中提供完整的结果。 -
快速生成 ID(如API
EVENTUAL_NO_LOOKUP
所示)— 您可以创建新的匹配ID,而无需查找现有匹配 ID。更新的记录保存在后台。此选项的响应速度最快。建议仅用于唯一记录。
-
-
对于 “记录” 属性,
-
输入唯一 ID 的值。
-
根据工作流程中配置的规则,为每个匹配键输入一个值,该值将与现有记录相匹配。
-
-
选择 “查找匹配 ID” 并保存记录。
将显示一条成功消息,说明已找到匹配 ID 或生成了新的匹配 ID 并保存了记录。
-
在成功消息中查看相应的匹配 ID 和保存到匹配工作流程的关联规则。
-
(可选)要复制匹配 ID,请选择 “复制”。
-
- API
-
使用 API 修改或生成匹配 ID
注意
要成功调用此 API,您必须先使用该 API 成功运行基于规则的匹配工作流程。StartMatchingJob
有关支持的编程语言的完整列表,请参阅 GenerateMatchID 的 “另请参阅” 部分。
-
打开终端或命令提示符发出 API 请求。
-
向以下端点创建 POST 请求:
/matchingworkflows/workflowName/generateMatches
-
在请求标头中,将内容类型设置为 application/json。
-
在请求 URI 中,指定您的
workflowName
。必
workflowName
须:-
长度介于 1 到 255 个字符之间
-
匹配模式 [a-za-z_0-9-] *
-
-
对于请求正文,请提供以下 JSON:
{ "processingType": "string", "records": [ { "inputSourceARN": "string", "recordAttributeMap": { "string" : "string" }, "uniqueId": "string" } ] }
其中:
-
processingType
(可选)-默认为CONSISTENT
。选择以下值之一:-
CONSISTENT
-以较慢的响应时间获得最高的精度 -
EVENTUAL
-通过后台处理实现更快的初始响应 -
EVENTUAL_NO_LOOKUP
-当已知记录是唯一时,可实现最快的响应
-
-
records
(必填)-仅包含一个记录对象的数组
-
-
发送 请求。
如果成功,您将收到状态码 200 的响应和包含以下内容的 JSON 正文:
{ "failedRecords": [ { "errorMessage": "string", "inputSourceARN": "string", "uniqueId": "string" } ], "matchGroups": [ { "matchId": "string", "matchRule": "string", "records": [ { "inputSourceARN": "string", "recordId": "string" } ] } ] }
如果呼叫失败,您可能会收到以下错误之一:
-
403- AccessDeniedException 如果你没有足够的访问权限
-
404- ResourceNotFoundException 如果找不到资源
-
429- ThrottlingException 如果请求被限制
-
400- ValidationException 如果输入未通过验证
-
500- InternalServerException 如果内部服务出现故障
-
-