기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
기계 학습 기반 매칭 워크플로 생성
기계 학습 기반 일치는 입력한 모든 데이터에서 레코드를 일치시키려고 시도하는 사전 설정 프로세스입니다. 기계 학습 기반 일치 워크플로를 사용하면 일반 텍스트 데이터를 비교하여 기계 학습 모델을 사용하여 광범위한 일치 항목을 찾을 수 있습니다.
참고
기계 학습 모델은 해시된 데이터의 비교를 지원하지 않습니다.
가 데이터에서 두 개 이상의 레코드 간에 일치하는 항목을 AWS Entity Resolution 찾으면 다음을 할당합니다.
-
일치 신뢰도 수준 백분율입니다.
ML 기반 매칭 워크플로의 출력을 데이터 서비스 공급자 매칭을 위한 입력으로 사용하거나 그 반대로 특정 목표를 달성할 수 있습니다. 예를 들어 ML 기반 일치를 실행하여 먼저 자체 레코드의 데이터 소스에서 일치 항목을 찾을 수 있습니다. 하위 집합이 일치하지 않는 경우 공급자 서비스 기반 일치를 실행하여 추가 일치 항목을 찾을 수 있습니다.
ML 기반 매칭 워크플로를 생성하려면:
-
에 로그인 AWS Management Console 하고를 사용하여 AWS Entity Resolution 콘솔
을 엽니다 AWS 계정 (아직 수행하지 않은 경우). -
왼쪽 탐색 창의 워크플로에서 일치를 선택합니다.
-
매칭 워크플로 페이지의 오른쪽 상단 모서리에서 매칭 워크플로 생성을 선택합니다.
-
1단계: 일치하는 워크플로 세부 정보 지정에서 다음을 수행합니다.
-
일치하는 워크플로 이름과 선택적 설명을 입력합니다.
-
데이터 입력의 경우 드롭다운에서 AWS Glue 데이터베이스를 선택하고 AWS Glue 테이블을 선택한 다음 해당 스키마 매핑을 선택합니다.
최대 20개의 데이터 입력을 추가할 수 있습니다.
-
데이터 정규화 옵션은 기본적으로 선택되므로 데이터 입력이 일치하기 전에 정규화됩니다. 데이터를 정규화하지 않으려면 데이터 정규화 옵션을 선택 취소합니다.
-
서비스 액세스 권한을 지정하려면 옵션을 선택하고 권장 조치를 취합니다.
옵션 권장 조치 새 서비스 역할 생성 및 사용 -
AWS Entity Resolution 는이 테이블에 필요한 정책을 사용하여 서비스 역할을 생성합니다.
-
기본 서비스 역할 이름은
entityresolution-matching-workflow-<timestamp>
입니다. -
역할을 생성하고 정책을 연결할 수 있는 권한이 있어야 합니다.
-
입력 데이터가 암호화된 경우 이 데이터는 KMS 키로 암호화됩니다 옵션을 선택합니다. 그런 다음 데이터 입력을 복호화하는 데 사용되는 AWS KMS 키를 입력합니다.
기존 서비스 역할 사용 -
드롭다운 목록에서 기존 서비스 역할 이름을 선택합니다.
역할을 나열할 권한이 있는 경우 역할 목록이 표시됩니다.
역할을 나열할 수 있는 권한이 없는 경우 사용하려는 역할의 Amazon 리소스 이름(ARN)을 입력할 수 있습니다.
기존 서비스 역할이 없는 경우 기존 서비스 역할 사용 옵션을 사용할 수 없습니다.
-
IAM에서 보기 외부 링크를 선택하여 서비스 역할을 확인합니다.
기본적으로 AWS Entity Resolution 는 필요한 권한을 추가하기 위해 기존 역할 정책을 업데이트하려고 시도하지 않습니다.
-
-
(선택 사항) 리소스에 대해 태그를 활성화하려면 새 태그 추가를 선택한 다음 키 및 값 페어를 입력합니다.
-
다음을 선택합니다.
-
-
2단계: 매칭 기법 선택:
-
일치 방법에서 기계 학습 기반 일치를 선택합니다.
-
처리 주기에서 수동 옵션이 선택됩니다.
이 옵션을 사용하면 대량 업데이트에 대해 온디맨드로 워크플로를 실행할 수 있습니다.
-
다음을 선택합니다.
-
-
3단계: 데이터 출력 및 형식 지정:
-
데이터 출력 대상 및 형식에서 데이터 출력의 Amazon S3 위치와 데이터 형식이 정규화된 데이터인지 원래 데이터인지 선택합니다.
-
암호화에 암호화 설정 사용자 지정을 선택한 경우 AWS KMS 키 ARN을 입력합니다.
-
시스템 생성 출력을 봅니다.
-
데이터 출력에서 포함하거나 숨기거나 마스킹할 필드를 결정한 다음 목표에 따라 권장 조치를 취합니다.
목표 권장 옵션 필드 포함 출력 상태를 포함으로 유지합니다. 필드 숨기기(출력에서 제외) 출력 필드를 선택한 다음 숨기기를 선택합니다. 필드 마스킹 출력 필드를 선택한 다음 해시 출력을 선택합니다. 이전 설정 재설정 재설정을 선택합니다. -
다음을 선택합니다.
-
-
4단계: 검토 및 생성의 경우:
-
이전 단계에서 선택한 내용을 검토하고 필요한 경우 편집하세요.
-
[Create and run]을 선택합니다.
일치하는 워크플로가 생성되었고 작업이 시작되었음을 나타내는 메시지가 나타납니다.
-
-
일치하는 워크플로 세부 정보 페이지의 지표 탭에서 마지막 작업 지표에서 다음을 확인합니다.
-
작업 ID입니다.
-
일치하는 워크플로 작업의 상태: 대기열에 있음, 진행 중, 완료됨, 실패
-
워크플로 작업에 대해 완료된 시간입니다.
-
처리된 레코드 수입니다.
-
처리되지 않은 레코드 수입니다.
-
생성된 고유 일치 IDs.
-
입력 레코드 수입니다.
작업 기록에서 이전에 실행된 일치하는 워크플로 작업에 대한 작업 지표를 볼 수도 있습니다.
-
-
일치하는 워크플로 작업이 완료된 후(상태가 완료됨) 데이터 출력 탭으로 이동한 다음 Amazon S3 위치를 선택하여 결과를 볼 수 있습니다.
-
(수동 처리 유형만 해당) 수동 처리 유형으로 기계 학습 기반 매칭 워크플로를 생성한 경우 매칭 워크플로 세부 정보 페이지에서 워크플로 실행을 선택하여 언제든지 매칭 워크플로를 실행할 수 있습니다.