修改或產生規則型比對工作流程的比對 ID - AWS Entity Resolution

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

修改或產生規則型比對工作流程的比對 ID

相符 ID 是 產生的識別符, AWS Entity Resolution 並在執行相符工作流程後套用至每個相符的記錄集。這是輸出中包含的相符工作流程中繼資料的一部分。

當您需要更新現有客戶的記錄或將新客戶新增至資料集時,您可以使用 AWS Entity Resolution 主控台或 GenerateMatchID API。修改現有的比對 ID 有助於在更新客戶資訊時保持一致性,同時在將先前無法識別的客戶新增至系統時,需要產生新的比對 ID。

注意

無論您使用 主控台或 API,都需支付額外費用。您選擇的處理類型會影響操作的準確性和回應時間。

重要

如果您在任務進行時撤銷對 S3 儲存貯體的 AWS Entity Resolution 許可, AWS Entity Resolution 仍會處理結果輸出至 S3 並收取費用,但無法將結果交付至您的儲存貯體。若要避免此問題,請先確定 AWS Entity Resolution 具有寫入 S3 儲存貯體的正確許可,再啟動任務。如果在處理期間撤銷許可, AWS Entity Resolution 會在您還原正確的儲存貯體許可後,嘗試在任務完成後最多 30 天內重新交付結果。

下列程序會引導您完成查詢或產生相符 ID、選取處理類型,以及檢視結果的程序。

Console
使用主控台修改或產生相符 ID
  1. 登入 AWS Management Console ,並在 https://https://console.aws.amazon.com/entityresolution/ 開啟 AWS Entity Resolution 主控台。

  2. 在左側導覽窗格中的工作流程下,選擇相符

  3. 選擇已處理的規則型比對工作流程 (任務狀態已完成)。

  4. 在相符工作流程詳細資訊頁面上,選擇相符 IDs索引標籤。

  5. 選擇修改或產生比對 ID

    注意

    修改或產生比對 ID 選項僅適用於使用自動處理節奏的比對工作流程。如果您已選取手動處理節奏,此選項將顯示為非作用中。若要使用此選項,請編輯工作流程以使用自動處理節奏。如需編輯工作流程的詳細資訊,請參閱 編輯相符的工作流程

  6. 從下拉式清單中選取AWS Glue 資料表

    如果工作流程中只有一個 AWS Glue 資料表,預設會選取它。

  7. 選擇處理類型

    • 一致 – 您可以查詢現有的配對 ID,或立即產生並儲存新的配對 ID。此選項具有最高的準確度和較慢的回應時間。

    • 背景 (在 API EVENTUAL 中顯示為 ) – 您可以立即查詢現有的比對 ID 或產生新的比對 ID。更新後的記錄會儲存在背景中。此選項具有快速的初始回應,並在稍後於 S3 中提供完整的結果。

    • 快速 ID 產生 (在 API EVENTUAL_NO_LOOKUP中顯示為 ) – 您可以建立新的比對 ID,而無需查詢現有的比對 ID。更新後的記錄會儲存在背景中。此選項有最快的回應。建議僅用於唯一記錄。

  8. 對於記錄屬性

    1. 輸入唯一 ID 的值

    2. 根據您工作流程中設定的規則,輸入與現有記錄相符的每個相符金鑰的值

  9. 選擇尋找配對 ID 並儲存記錄

    成功訊息隨即出現,指出找到相符 ID 或產生新的相符 ID,並儲存記錄。

  10. 在成功訊息中,檢視對應的相符 ID 和儲存至相符工作流程的相關規則。

  11. (選用) 若要複製比對 ID,請選擇複製

API
使用 API 修改或產生相符 ID
注意

若要成功呼叫此 API,您必須先使用 StartMatchingJob API 成功執行規則型比對工作流程。

如需支援程式設計語言的完整清單,請參閱 GenerateMatchID另請參閱一節。

  1. 開啟終端機或命令提示以提出 API 請求。

  2. 建立對下列端點的 POST 請求:

    /matchingworkflows/workflowName/generateMatches
  3. 在請求標頭中,將 Content-type 設定為 application/json。

  4. 在請求 URI 中,指定您的 workflowName

    必須workflowName

    • 長度介於 1 到 255 個字元之間

    • 比對模式 【a-zA-Z_0-9-】*

  5. 針對請求內文,請提供下列 JSON:

    { "processingType": "string", "records": [ { "inputSourceARN": "string", "recordAttributeMap": { "string" : "string" }, "uniqueId": "string" } ] }

    其中:

    • processingType (選用) - 預設為 CONSISTENT。選擇下列其中一個值:

      • CONSISTENT - 提供最高準確度和較慢的回應時間

      • EVENTUAL - 使用背景處理加快初始回應

      • EVENTUAL_NO_LOOKUP - 已知記錄是唯一的記錄時,提供最快的回應

    • records (必要) - 僅包含一個記錄物件的陣列

  6. 傳送 請求。

    如果成功,您會收到狀態碼為 200 的回應,以及包含下列項目的 JSON 內文:

    { "failedRecords": [ { "errorMessage": "string", "inputSourceARN": "string", "uniqueId": "string" } ], "matchGroups": [ { "matchId": "string", "matchRule": "string", "records": [ { "inputSourceARN": "string", "recordId": "string" } ] } ] }

    如果呼叫失敗,您可能會收到下列其中一個錯誤:

    • 403 - 如果您沒有足夠的存取權,則為 AccessDeniedException

    • 如果找不到資源,則為 404 - ResourceNotFoundException

    • 429 - 如果請求已調節,則 ThrottlingException

    • 400 - 如果輸入驗證失敗,則 ValidationException

    • 500 - 如果發生內部服務故障,則為 InternalServerException