일치하는 워크플로를 사용하여 입력 데이터 일치 - AWS Entity Resolution

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

일치하는 워크플로를 사용하여 입력 데이터 일치

일치 워크플로는 서로 다른 입력 소스의 데이터를 결합 및 비교하고 서로 다른 일치 기술을 기반으로 일치하는 레코드를 결정하는 데이터 처리 작업입니다.는 지정된 위치에서 데이터를AWS Entity Resolution읽고, 레코드 간 일치 항목을 찾고, 일치하는 각 데이터 세트에 일치 ID를 할당합니다.

다음 다이어그램은 일치하는 워크플로를 생성하는 방법을 요약합니다.

A summary of the four steps to create a matching workflow in AWS Entity Resolution

워크플로 유형 일치

AWS Entity Resolution는 세 가지 유형의 일치하는 워크플로를 지원합니다.

규칙 기반 일치

구성 가능한 규칙을 사용하여 지정된 필드의 정확한 일치 또는 퍼지 일치를 기반으로 일치하는 레코드를 식별합니다. 비슷한 철자가 지정된 이름이나 형식이 다른 주소와 같은 일치 기준을 정의합니다.

기계 학습 기반 매칭

기계 학습 모델을 사용하여 데이터에 변형, 오류 또는 누락된 필드가 있는 경우에도 유사한 레코드를 식별합니다. 이 접근 방식은 규칙 기반 일치보다 더 복잡한 일치를 감지할 수 있습니다.

공급자 서비스 기반 일치

타사 데이터 공급자를 사용하여 일치시키기 전에 데이터를 보강하고 검증합니다. 이 유형의 일치는 Amazon Connect Customer Profiles 출력과 호환되지 않습니다.

데이터 출력 옵션

AWS Entity Resolution는 다음에 데이터 출력 파일을 쓸 수 있습니다.

  • 지정한 Amazon S3 위치

  • Amazon Connect Customer Profiles(고객 데이터 중복 제거용)

중요

Amazon Connect Customer Profiles로 내보내기는 공급자 기반 일치와 호환되지 않습니다. Amazon Connect Customer Profiles로 내보내려면 규칙 기반 매칭 또는 기계 학습 기반 매칭을 사용해야 합니다.

원하는 경우AWS Entity Resolution를 사용하여 출력 데이터를 해시할 수 있으므로 데이터에 대한 제어를 유지할 수 있습니다.

다음 표에는 일치하는 워크플로의 세 가지 유형과 지원되는 출력 대상이 나와 있습니다.

일치 유형(Matching type) S3 출력 Customer Profiles 출력
규칙 기반
기계 학습 기반
공급자 서비스 기반 아니요

워크플로 결과 일치

일치하는 워크플로를 생성하고 실행한 후 지정된 S3 위치 또는 Amazon Connect Customer Profiles에서 결과를 볼 수 있습니다. 일치하는 워크플로는 데이터가 IDs를 생성합니다.

일치하는 워크플로는 여러 번 실행될 수 있으며 결과(성공 또는 오류)는 jobId 이름이 인 폴더에 기록됩니다.

S3 출력 대상에 대한 각 실행의 경우:

  • 데이터 출력에는 성공적인 일치를 위한 파일과 오류에 대한 파일이 모두 포함됩니다.

  • 성공한 결과는 여러 파일이 포함된 success 폴더에 기록됩니다.

  • 여러 필드가 있는 error 폴더에 오류가 기록됩니다.

Amazon Connect Customer Profiles 출력 대상의 각 실행에 대해:

  • 중복된 고객 레코드는 Amazon Connect 인스턴스로 직접 전송됩니다.

  • AWS Entity Resolution콘솔에서 최근 작업 기록을 볼 수 있습니다.

  • Amazon Connect의 기존 프로필은 중복 제거 프로세스에 포함되지 않습니다.

일치하는 워크플로를 생성하고 실행한 후 규칙 기반 매칭 또는 기계 학습(ML) 매칭의 출력을 공급자 서비스 기반 매칭에 대한 입력으로 사용하거나 비즈니스 요구 사항을 충족하기 위한 다른 방법으로 사용할 수 있습니다.

예를 들어 공급자 구독 비용을 절약하려면 먼저 규칙 기반 일치를 실행하여 데이터에서 일치 항목을 찾을 수 있습니다. 그런 다음 일치하지 않는 레코드의 하위 집합을 공급자 서비스 기반 일치로 보낼 수 있습니다. Customer Profiles로 내보내려는 경우 규칙 기반 또는 기계 학습 기반 일치만 사용해야 합니다.

오류 문제 해결에 대한 자세한 내용은 섹션을 참조하세요일치하는 워크플로 문제 해결.