執行自訂 ID 映射工作流程 - AWS Entity Resolution

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

執行自訂 ID 映射工作流程

執行 ID 映射工作流程時,您可以為輸出資料指定與原始設定不同的 Amazon S3 位置。您也可以選擇三種執行類型之一來選擇如何處理您的資料:批次 (處理所有資料)、增量 (僅處理新的或變更的資料),或僅刪除 (僅處理刪除請求)。

使用新的輸出目的地執行 ID 映射工作流程
  1. 登入 AWS 管理主控台 ,並在 https://https://console.aws.amazon.com/entityresolution/ 開啟 AWS Entity Resolution 主控台。

  2. 在左側導覽窗格中的工作流程下,選擇 ID 映射

  3. 選擇您要執行的 ID 映射工作流程。

  4. 在 ID 映射工作流程詳細資訊頁面上,選擇執行工作流程,然後選擇使用新輸出目的地執行

  5. 針對資料輸出目的地,設定下列項目。

    1. 針對執行類型,選取下列其中一個選項。

      • 批次 – 處理整個 ID 映射表。

        建議用於初始設定、定期完整重新整理,或來源和目標 ID 命名空間發生重大變更時。

      • 增量 – 僅處理來源或目標 ID 命名空間中的新記錄、更新記錄或刪除的記錄。

        建議用於頻繁更新、每日執行或即時資料同步。

      • 僅限刪除 – 僅處理目標 ID 命名空間中已刪除的記錄。

        建議用於快速同步移除。

    2. 選擇資料輸出的 Amazon S3 位置

    3. 對於加密,請執行下列其中一項操作:

      • 保留預設加密設定

      • 選擇自訂加密設定,然後輸入AWS KMS 金鑰 ARN 或選擇建立 AWS KMS 金鑰

  6. 若要指定服務存取許可,請選擇 選項並採取建議的動作。

    選項 建議的動作
    建立和使用新的服務角色
    • AWS Entity Resolution 會建立具有此資料表所需政策的服務角色。

    • 預設的服務角色名稱entityresolution-id-mapping-workflow-<timestamp>

    • 您必須具有建立角色和連接政策的許可。

    • 如果您的輸入資料已加密,請選擇 KMS 金鑰加密此資料選項。然後,輸入用來解密資料輸入的AWS KMS 金鑰

    使用現有的服務角色
    1. 從下拉式清單中選擇現有的服務角色名稱

      如果您有列出角色的許可,則會顯示角色清單。

      如果您沒有列出角色的許可,您可以輸入要使用的角色的 Amazon Resource Name (ARN)。

      如果沒有現有的服務角色,則無法使用使用現有服務角色的選項。

    2. 選擇 IAM 外部連結中的檢視,以檢視服務角色。

      根據預設, AWS Entity Resolution 不會嘗試更新現有的角色政策來新增必要的許可。

  7. 選擇執行

  8. 在相符的工作流程詳細資訊頁面的指標索引標籤上,檢視最後一個任務指標下的下列項目:

    • 任務 ID

    • 工作流程任務完成的時間

    • 相符工作流程任務的狀態已佇列進行中已完成失敗

    • 處理的記錄數量

    • 未處理的記錄數量

    • 輸入記錄的數量

    • 產生的唯一比對 IDs數目。

    • 新映射記錄的數量。

    • 新映射目標記錄的數量。

    • 新映射來源記錄的數量。

    • 已移除的新映射來源記錄數目。

    • 已移除的新映射目標記錄數目。

    • 已移除的新映射記錄數目。

    任務歷史記錄下,您也可以檢視先前執行 ID 映射工作流程任務的任務指標。

  9. ID 映射工作流程任務完成後 (狀態已完成),請選擇資料輸出,然後選擇您的 Amazon S3 位置以檢視結果。

    取得 CSV 檔案後,您可以加入 RAMPIDTRANSCODED_ID