

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Resolusi Entitas AWS Glosarium
<a name="glossary"></a>

## Amazon Resource Name (ARN)
<a name="arn-definition"></a>

Pengidentifikasi unik untuk AWS sumber daya. ARNs diperlukan saat Anda perlu menentukan sumber daya secara jelas di semua Resolusi Entitas AWS, seperti dalam Resolusi Entitas AWS kebijakan, tag Amazon Relational Database Service (Amazon RDS), dan panggilan API.

## Jenis atribut
<a name="attribute-type-defn"></a>

Jenis atribut untuk bidang input. **Saat [membuat pemetaan skema](create-schema-mapping.md), Anda memilih **tipe Atribut** dari daftar nilai yang telah dikonfigurasi sebelumnya seperti **Nama**, **Alamat**, **Nomor telepon**, atau Alamat email.** Jenis atribut memberi tahu jenis data Resolusi Entitas AWS apa yang Anda sajikan, memungkinkannya diklasifikasikan dan dinormalisasi dengan benar.

## Pemrosesan otomatis
<a name="incremental-processing"></a>

Opsi irama pemrosesan untuk pekerjaan alur kerja yang cocok yang memungkinkannya dijalankan secara otomatis saat input data Anda berubah. 

Opsi ini hanya tersedia untuk [pencocokan berbasis aturan](#rule-based-matching-defn).

Secara default, irama pemrosesan untuk pekerjaan alur kerja yang cocok diatur ke [**Manual**](#manual-processing), yang memungkinkannya dijalankan sesuai permintaan. Anda dapat mengatur Pemrosesan **otomatis** untuk menjalankan pekerjaan alur kerja yang cocok secara otomatis saat input data Anda berubah. Ini membuat output up-to-date alur kerja Anda yang cocok.

## AWS KMS key ARN
<a name="kms-arn-defn"></a>

Ini adalah Nama Sumber Daya AWS KMS Amazon Anda (ARN) untuk enkripsi saat istirahat. Jika tidak disediakan, sistem akan menggunakan kunci KMS Resolusi Entitas AWS terkelola.

## Alur kerja Batch
<a name="batch-defn"></a>

Proses yang berjalan pada interval terjadwal untuk mencocokkan dan menyelesaikan data di seluruh kumpulan data. Alur kerja batch paling baik Resolusi Entitas AWS digunakan untuk penyiapan awal, penyegaran penuh berkala, dan skenario dengan perubahan signifikan pada kumpulan data sumber dan target.

## Cleartext
<a name="cleartext-defn"></a>

Data yang tidak dilindungi secara kriptografi.

## Tingkat kepercayaan diri (ConfidenceLevel)
<a name="confidence-level-defn"></a>

Untuk pencocokan ML, ini adalah tingkat kepercayaan yang diterapkan Resolusi Entitas AWS ketika ML mengidentifikasi kumpulan rekaman yang cocok. Ini adalah bagian dari [metadata alur kerja yang cocok](#matching-workflow-metadata) yang akan disertakan dalam output.

## Dekripsi
<a name="decryption-defn"></a>

Proses mengubah data terenkripsi kembali ke bentuk aslinya. Dekripsi hanya dapat dilakukan jika Anda memiliki akses ke kunci rahasia.

## Enkripsi
<a name="encryption-defn"></a>

Proses pengkodean data ke dalam bentuk yang muncul acak menggunakan nilai rahasia yang disebut kunci. Tidak mungkin untuk menentukan plaintext asli tanpa akses ke kunci.

## Nama grup
<a name="group-name-defn"></a>

**Nama Grup** mereferensikan seluruh grup kolom input dan dapat membantu Anda mengelompokkan data yang diuraikan bersama untuk tujuan pencocokan.

Misalnya, jika ada tiga bidang input:**first\$1name**,, dan **middle\$1name****last\$1name**, Anda dapat mengelompokkannya bersama-sama dengan memasukkan **nama Grup** **full\$1name** untuk pencocokan dan output.

## Hash
<a name="hash-defn"></a>

Hashing berarti menerapkan algoritma kriptografi yang menghasilkan string karakter yang tidak dapat diubah dan unik dengan ukuran tetap — disebut hash. Resolusi Entitas AWS menggunakan protokol hash Secure Hash Algorithm 256-bit (SHA256) dan akan menampilkan string karakter 32-byte. Di Resolusi Entitas AWS, Anda dapat memilih apakah akan hash nilai data dalam output Anda.

## Protokol hash () HashingProtocol
<a name="hash-protocol-defn"></a>

Resolusi Entitas AWS menggunakan protokol hash Secure Hash Algorithm 256-bit (SHA256) dan akan menampilkan string karakter 32-byte. Ini adalah bagian dari [metadata alur kerja yang cocok](#matching-workflow-metadata) yang akan disertakan dalam output.

## Metode pemetaan ID
<a name="id-mapping-method-defn"></a>

Bagaimana Anda ingin pemetaan ID dilakukan. 

Ada dua metode pemetaan ID: 
+ Berbasis aturan — Metode yang digunakan untuk menggunakan aturan pencocokan untuk menerjemahkan data pihak pertama dari sumber ke target dalam alur kerja pemetaan ID.
+ Layanan penyedia — Metode yang digunakan untuk menggunakan layanan penyedia untuk menerjemahkan data yang disandikan pihak ketiga dari sumber ke target dalam alur kerja pemetaan ID.

  Resolusi Entitas AWS saat ini mendukung LiveRamp sebagai metode pemetaan ID berbasis layanan penyedia. Anda harus berlangganan AWS Data Exchange untuk LiveRamp menggunakan metode ini. Untuk informasi selengkapnya, lihat [Langkah 1: Berlangganan layanan penyedia di AWS Data Exchange](prepare-third-party-input-data.md#subscribe-provider-service).

## Alur kerja pemetaan ID
<a name="id-mapping-workflow-defn"></a>

Pekerjaan pemrosesan data yang memetakan data dari sumber data input ke target data input berdasarkan metode pemetaan ID yang ditentukan. Ini menghasilkan tabel pemetaan ID. Alur kerja ini mengharuskan Anda untuk menentukan [metode pemetaan ID](#id-mapping-method-defn) dan data input yang ingin Anda terjemahkan dari sumber ke target. 

Anda dapat mengatur alur kerja pemetaan ID untuk dijalankan sendiri Akun AWS atau di dua. Akun AWS

## Ruang nama ID
<a name="id-namespace-defn"></a>

[Sumber daya Resolusi Entitas AWS yang berisi metadata yang menjelaskan kumpulan data di beberapa Akun AWS dan cara menggunakan kumpulan data ini dalam alur kerja pemetaan ID.](#id-mapping-workflow-defn)

Ada dua jenis ruang nama ID: `SOURCE` dan. `TARGET` `SOURCE`Berisi konfigurasi untuk data sumber yang akan diproses dalam alur kerja pemetaan ID. `TARGET`Berisi konfigurasi data target yang akan diselesaikan oleh semua sumber. Untuk menentukan data masukan yang ingin Anda selesaikan di dua Akun AWS, buat sumber namespace ID dan target namespace ID untuk menerjemahkan data Anda dari satu set () ke set lain ()`SOURCE`. `TARGET`

Setelah Anda dan anggota lain membuat ruang nama ID dan menjalankan alur kerja pemetaan ID, Anda dapat bergabung dengan kolaborasi AWS Clean Rooms untuk menjalankan gabungan multi tabel pada tabel pemetaan ID, dan menganalisis data.

Untuk informasi selengkapnya, silakan lihat [Panduan Pengguna AWS Clean Rooms](https://docs.aws.amazon.com/clean-rooms/latest/userguide/what-is.html).

## Alur kerja tambahan
<a name="incremental-defn"></a>

Proses yang hanya cocok dan menyelesaikan catatan baru atau yang diperbarui sejak terakhir kali dijalankan, daripada memproses seluruh kumpulan data. Alur kerja tambahan paling baik Resolusi Entitas AWS digunakan untuk pembaruan yang sering guna menjaga kesegaran data ketika hanya sebagian kecil dari kumpulan data yang telah berubah.

## Bidang masukan
<a name="input-field-defn"></a>

Bidang input sesuai dengan nama kolom dari tabel data AWS Glue input Anda.

## Sumber Masukan ARN (InputSourceARN)
<a name="input-source-arn-defn"></a>

Nama Sumber Daya Amazon (ARN) yang dihasilkan untuk input AWS Glue tabel. Ini adalah bagian dari [metadata alur kerja yang cocok](#matching-workflow-metadata) yang akan disertakan dalam output.

## Pencocokan berbasis pembelajaran mesin
<a name="ml-matching-defn"></a>

Pencocokan berbasis pembelajaran mesin (pencocokan ML) menemukan kecocokan di seluruh data Anda yang mungkin tidak lengkap atau mungkin tidak terlihat persis sama. Pencocokan ML adalah proses preset yang akan mencoba mencocokkan catatan di semua data yang Anda masukkan. Pencocokan ML mengembalikan [ID kecocokan](#match-id-defin) dan [tingkat kepercayaan](#confidence-level-defn) untuk setiap kumpulan data yang cocok.

## Pemrosesan manual
<a name="manual-processing"></a>

Opsi irama pemrosesan untuk pekerjaan alur kerja yang cocok yang memungkinkannya dijalankan sesuai permintaan. 

Opsi ini diatur secara default dan tersedia untuk pencocokan berbasis [aturan dan pencocokan berbasis](#rule-based-matching-defn) [pembelajaran mesin](#ml-matching-defn).

## Many-to-Many pencocokan
<a name="many-to-many-defin"></a>

Many-to-many pencocokan membandingkan beberapa contoh data serupa. Nilai di bidang input yang telah ditetapkan kunci kecocokan yang sama akan dicocokkan satu sama lain, terlepas dari apakah mereka berada di bidang input yang sama atau bidang input yang berbeda. 

Misalnya, Anda mungkin memiliki beberapa kolom input nomor telepon seperti `mobile_phone` dan `home_phone` yang memiliki tombol kecocokan yang sama “Telepon”. Gunakan many-to-many pencocokan untuk membandingkan data di bidang `mobile_phone` input dengan data di bidang `mobile_phone` input dan data di bidang `home_phone` input. 

Aturan pencocokan mengevaluasi data di beberapa bidang input dengan kunci pencocokan yang sama dengan operasi (atau), dan one-to-many pencocokan membandingkan nilai di beberapa bidang input. Ini berarti bahwa jika ada kombinasi `mobile_phone` atau `home_phone` kecocokan antara dua catatan, tombol pencocokan “Telepon” akan mengembalikan kecocokan. Untuk tombol kecocokan “Telepon” untuk menemukan kecocokan, `Record One mobile_phone = Record Two mobile_phone` `Record One mobile_phone = Record Two home_phone` ATAU ATAU `Record One home_phone = Record Two home_phone` ATAU`Record One home_phone = Record Two mobile_phone`.

## ID Pertandingan (MatchID)
<a name="match-id-defin"></a>

Untuk pencocokan berbasis aturan dan pencocokan ML, ini adalah ID yang dihasilkan oleh Resolusi Entitas AWS dan diterapkan ke setiap kumpulan rekaman yang cocok. Ini adalah bagian dari [metadata alur kerja yang cocok](#matching-workflow-metadata) yang akan disertakan dalam output.

## Kunci kecocokan (MatchKey)
<a name="match-key-defn"></a>

Kunci pertandingan menginstruksikan bidang input Resolusi Entitas AWS mana yang harus dipertimbangkan sebagai data serupa dan mana yang harus dipertimbangkan sebagai data yang berbeda. Ini membantu Resolusi Entitas AWS secara otomatis mengonfigurasi aturan pencocokan berbasis aturan dan membandingkan data serupa yang disimpan di bidang input yang berbeda. 

Jika ada beberapa jenis informasi nomor telepon seperti bidang `mobile_phone` input dan bidang `home_phone` input dalam data Anda yang ingin Anda bandingkan bersama-sama, Anda bisa memberi keduanya tombol kecocokan “Telepon”. [Kemudian pencocokan berbasis aturan dapat dikonfigurasi untuk membandingkan data menggunakan pernyataan “atau” di semua bidang input dengan kunci kecocokan “Telepon” (lihat [One-to-One Pencocokan dan Many-to-Many Pencocokan](#one-to-one-matching-defn) definisi di bagian Alur Kerja Pencocokan).](#many-to-many-defin) 

Jika Anda ingin pencocokan berbasis aturan untuk mempertimbangkan berbagai jenis informasi nomor telepon sepenuhnya secara terpisah, Anda dapat membuat kunci pencocokan yang lebih spesifik seperti “Mobile\$1Phone” dan “Home\$1Phone”. Kemudian, saat menyiapkan alur kerja yang cocok, Anda dapat menentukan bagaimana setiap tombol pencocokan telepon akan digunakan dalam pencocokan berbasis aturan. 

Jika no MatchKey ditentukan untuk bidang input tertentu, itu tidak dapat digunakan dalam pencocokan tetapi dapat dilakukan melalui proses alur kerja yang cocok dan dapat menjadi output jika diinginkan.

## Cocokkan nama kunci
<a name="match-key-name-defn"></a>

Nama yang ditetapkan ke kunci Match.

## Aturan pertandingan (MatchRule)
<a name="match-rule-defn"></a>

Untuk pencocokan berbasis aturan, ini adalah nomor aturan yang diterapkan yang menghasilkan kumpulan rekaman yang cocok. Ini adalah bagian dari [metadata alur kerja yang cocok](#matching-workflow-metadata) yang akan disertakan dalam output.

## Pencocokan
<a name="matching-definition"></a>

Proses menggabungkan dan membandingkan data dari berbagai bidang input, tabel, atau database dan menentukan mana yang sama — atau “cocok” — berdasarkan memenuhi kriteria pencocokan tertentu (misalnya, baik melalui aturan atau model yang cocok).

## Alur kerja yang cocok
<a name="matching-workflow-definition"></a>

Proses yang Anda atur untuk menentukan data input untuk dicocokkan bersama dan bagaimana pencocokan harus dilakukan.

## Deskripsi alur kerja yang cocok
<a name="matching-workflow-description"></a>

Deskripsi opsional dari alur kerja yang cocok yang mungkin Anda pilih untuk dimasukkan. Deskripsi membantu Anda membedakan antara alur kerja yang cocok jika Anda membuat lebih dari satu.

## Nama alur kerja yang cocok
<a name="matching-workflow-name"></a>

Nama untuk alur kerja yang cocok yang Anda tentukan. 

**catatan**  
Nama alur kerja yang cocok harus unik. Mereka tidak dapat memiliki nama yang sama atau kesalahan akan dikembalikan.

## Metadata alur kerja yang cocok
<a name="matching-workflow-metadata"></a>

Informasi yang dihasilkan dan dihasilkan oleh Resolusi Entitas AWS selama pekerjaan alur kerja yang cocok. Informasi ini diperlukan pada output.

## Normalisasi () ApplyNormalization
<a name="normalization-defn"></a>

Pilih apakah akan menormalkan data input seperti yang didefinisikan dalam skema. Normalisasi menstandarisasi data dengan menghapus spasi ekstra dan karakter khusus dan menstandarisasi ke format huruf kecil. 

Misalnya, jika bidang input memiliki tipe atribut [Telepon penuh](#normalization-rule-phone), dan nilai dalam tabel input diformat sebagai`(123) 456-7890`, Resolusi Entitas AWS akan menormalkan nilai ke`1234567890`.

**catatan**  
Normalisasi hanya didukung jenis grup untuk [Nama](#normalization-rule-name), [Alamat](#normalization-rule-address), [Telepon](#normalization-rule-phone), dan [Email](#normalization-rule-email). 

Bagian berikut menjelaskan aturan normalisasi standar kami. 

Untuk pencocokan berbasis ML secara khusus, lihat. [Normalisasi (ApplyNormalization) — hanya berbasis ML](#normalization-ML-defn)

**Topics**
+ [Nama](#normalization-rule-name)
+ [Email](#normalization-rule-email)
+ [Telepon](#normalization-rule-phone)
+ [Alamat](#normalization-rule-address)
+ [Hashed](#normalization-rule-hashed)
+ [Source\$1ID](#normalization-rule-source-id)

### Nama
<a name="normalization-rule-name"></a>

**catatan**  
Normalisasi hanya didukung untuk tipe grup **Nama**.   
Jenis grup **Nama** muncul sebagai **Nama lengkap** di konsol dan seperti `NAME` di API.  
Jika Anda ingin menormalkan sub-tipe tipe grup **Nama:**   
Di konsol, tetapkan subtipe berikut ke grup **Nama lengkap: Nama depan**, **Nama** **tengah, dan **Nama** belakang**.
Di [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, tetapkan **Types** berikut ke `NAME` **GroupName**`NAME_FIRST`:`NAME_MIDDLE`,, dan. `NAME_LAST`
+ **TRIM = Memangkas** spasi putih di depan dan di belakang
+ **LOWERCASE** = Huruf kecil semua karakter alfa
+ **CONVERT\$1ACCENT=Surat beraksen** terselubung ke surat biasa
+ **REMOVE\$1ALL\$1NON\$1ALPHA=Menghapus semua karakter non-alfa [A-za-z**]

### Email
<a name="normalization-rule-email"></a>

**catatan**  
Normalisasi didukung untuk jenis grup **Email**.   
Jenis grup **Email** muncul sebagai **Alamat email** di konsol dan seperti `EMAIL_ADDRESS` di API.
+ **TRIM = Memangkas** spasi putih di depan dan di belakang
+ **LOWERCASE** = Huruf kecil semua karakter alfa
+ **CONVERT\$1ACCENT=Surat beraksen** terselubung ke surat biasa
+ **EMAIL\$1ADDRESS\$1UTIL\$1NORM=Menghapus** setiap titik (.) dari nama pengguna, menghapus apa pun setelah tanda plus (\$1) di nama pengguna, dan menstandarisasi variasi domain umum
+ **REMOVE\$1ALL\$1NON\$1EMAIL\$1CHARS=Menghapus semua karakter** [A-za-z0-9] dan [.@-] non-alpha-numeric

### Telepon
<a name="normalization-rule-phone"></a>

**catatan**  
Normalisasi hanya didukung untuk tipe grup **Telepon**.  
Jenis grup **Telepon** muncul sebagai **Telepon lengkap** di konsol dan seperti `PHONE` di API.  
Jika Anda ingin menormalkan sub-tipe tipe grup **Telepon**:   
Di konsol, tetapkan sub-tipe berikut ke grup **Telepon lengkap**: **Nomor telepon**, dan kode **negara telepon**.
Di [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, tetapkan **Types** berikut ke `PHONE` **GroupName`PHONE_NUMBER`:** dan. `PHONE_COUNTRYCODE`
+ **TRIM = Memangkas** spasi putih di depan dan di belakang
+ **REMOVE\$1ALL\$1NON\$1NUMERIC=Menghapus semua karakter non-numerik [0-9]**
+ **REMOVE\$1ALL\$1LEADING\$1ZEROES=Menghapus semua angka** nol di depan
+ **ENSURE\$1PREFIX\$1WITH\$1MAP, "phonePrefixMap"** = Memeriksa setiap nomor telepon dan mencoba mencocokkannya dengan pola di. phonePrefixMap Jika kecocokan ditemukan, aturan akan menambah atau mengubah awalan nomor telepon untuk memastikannya sesuai dengan format standar yang ditentukan dalam peta.

### Alamat
<a name="normalization-rule-address"></a>

**catatan**  
Normalisasi hanya didukung untuk jenis grup **Alamat**.   
Jenis grup **Alamat** muncul sebagai **Alamat lengkap** di konsol dan seperti `ADDRESS ` di API.  
Jika Anda ingin menormalkan sub-tipe tipe grup **Alamat**:   
Di konsol, tetapkan sub-tipe berikut ke grup **alamat lengkap: Alamat** **jalan 1, Alamat jalan** **2: Nama alamat** **jalan 3, Nama** **kota**, **Negara Bagian, **Negara****, dan **Kode pos t**
Di [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, tetapkan **Types** berikut ke `ADDRESS` **GroupName**`ADDRESS_STREET1`:`ADDRESS_STREET2`,,,`ADDRESS_STREET3`, `ADDRESS_CITY` `ADDRESS_STATE``ADDRESS_COUNTRY`, dan. `ADDRESS_POSTALCODE`
+ **TRIM = Memangkas** spasi putih di depan dan di belakang
+ **LOWERCASE** = Huruf kecil semua karakter alfa
+ **CONVERT\$1ACCENT=Surat beraksen** terselubung ke surat biasa
+ **REMOVE\$1ALL\$1NON\$1ALPHA=Menghapus semua karakter non-alfa [A-za-z**]
+ **[RENAME\$1WORDS menggunakan ADDRESS\$1RENAME\$1WORD\$1MAP=ganti kata-kata dalam string Alamat dengan kata-kata dari ADDRESS\$1RENAME\$1WORD\$1MAP](#ADDRESS_RENAME_WORD_MAP)**
+ **[RENAME\$1DELIMITERS menggunakan ADDRESS\$1RENAME\$1DELIMITER\$1MAP=ganti pembatas dalam string Alamat dengan string dari ADDRESS\$1RENAME\$1DELIMITER\$1MAP](#ADDRESS_RENAME_DELIMITER_MAP)**
+ **[RENAME\$1DIRECTIONS menggunakan ADDRESS\$1RENAME\$1DIRECTION\$1MAP=ganti pembatas dalam string Alamat dengan string dari ADDRESS\$1RENAME\$1DIRECTION\$1MAP](#ADDRESS_RENAME_DIRECTION_MAP)**
+ **[RENAME\$1NUMBERS menggunakan ADDRESS\$1RENAME\$1NUMBER\$1MAP= ganti angka dalam string Alamat dengan string dari ADDRESS\$1RENAME\$1NUMBER\$1MAP](#ADDRESS_RENAME_NUMBER_MAP.title)**
+ **[RENAME\$1SPECIAL\$1CHARS menggunakan ADDRESS\$1RENAME\$1SPECIAL\$1CHAR\$1MAP=ganti karakter khusus dalam string Alamat dengan string dari ADDRESS\$1RENAME\$1SPECIAL\$1CHAR\$1MAP](#ADDRESS_RENAME_SPECIAL_CHAR_MAP.title)**

#### ALAMAT\$1RENAME\$1WORD\$1MAP
<a name="ADDRESS_RENAME_WORD_MAP"></a>

Ini adalah kata-kata yang akan diganti namanya saat menormalkan string alamat.

```
"avenue": "ave",
 "bouled": "blvd",
 "circle": "cir",
 "circles": "cirs",
 "court": "ct",
 "centre": "ctr",
 "center": "ctr",
 "drive": "dr",
 "freeway": "fwy",
 "frwy": "fwy",
 "highway": "hwy",
 "lane": "ln",
 "parks": "park",
 "parkways": "pkwy",
 "pky": "pkwy",
 "pkway": "pkwy",
 "pkwys": "pkwy",
 "parkway": "pkwy",
 "parkwy": "pkwy",
 "place": "pl",
 "plaza": "plz",
 "plza": "plz",
 "road": "rd",
 "square": "sq",
 "squ": "sq",
 "sqr": "sq",
 "street": "st",
 "str": "st",
 "str.": "strasse"
```

#### ALAMAT\$1RENAME\$1DELIMITER\$1MAP
<a name="ADDRESS_RENAME_DELIMITER_MAP"></a>

Ini adalah pembatas yang akan diganti namanya saat menormalkan string alamat.

```
",": " ",
".": " ",
"[": " ",
"]": " ",
"/": " ",
"-": " ",
"#": " number "
```

#### ALAMAT\$1RENAME\$1DIRECTION\$1MAP
<a name="ADDRESS_RENAME_DIRECTION_MAP"></a>

Ini adalah pengidentifikasi arah yang akan diganti namanya saat menormalkan string alamat.

```
"east": "e",
"north": "n",
"south": "s",
"west": "w",
"northeast": "ne",
"northwest": "nw",
"southeast": "se",
"southwest": "sw"
```

#### ALAMAT\$1RENAME\$1NUMBER\$1MAP
<a name="ADDRESS_RENAME_NUMBER_MAP"></a>

Ini adalah string angka yang akan diganti namanya saat menormalkan string alamat.

```
"número": "number",
 "numero": "number",
 "no": "number",
 "núm": "number",
 "num": "number"
```

#### ALAMAT\$1RENAME\$1SPECIAL\$1CHAR\$1MAP
<a name="ADDRESS_RENAME_SPECIAL_CHAR_MAP"></a>

Ini adalah string karakter khusus yang akan diganti namanya saat menormalkan string alamat.

```
"ß": "ss",
 "ä": "ae",
 "ö": "oe",
 "ü": "ue",
 "ø": "o",
 "æ": "ae"
```

### Hashed
<a name="normalization-rule-hashed"></a>
+ **TRIM = Memangkas** spasi putih di depan dan di belakang

### Source\$1ID
<a name="normalization-rule-source-id"></a>
+ **TRIM = Memangkas** spasi putih di depan dan di belakang

## Normalisasi (ApplyNormalization) — hanya berbasis ML
<a name="normalization-ML-defn"></a>

Pilih apakah akan menormalkan data input seperti yang didefinisikan dalam skema. Normalisasi menstandarisasi data dengan menghapus spasi ekstra dan karakter khusus dan menstandarisasi ke format huruf kecil. 

Misalnya, jika bidang input memiliki tipe atribut`NAME`, dan nilai-nilai dalam tabel input diformat sebagai`Johns Smith`, Resolusi Entitas AWS akan menormalkan nilai ke`john smith`.

Bagian berikut menjelaskan aturan normalisasi untuk alur kerja pencocokan [berbasis pembelajaran mesin](#ml-matching-defn).

**Topics**
+ [Nama](#normalization-ML-defn-name)
+ [Email](#normalization-ML-defn-email)
+ [Telepon](#normalization-ML-defn-phone)

### Nama
<a name="normalization-ML-defn-name"></a>
+ **TRIM = Memangkas** spasi putih di depan dan di belakang
+ **LOWERCASE** = Huruf kecil semua karakter alfa

### Email
<a name="normalization-ML-defn-email"></a>
+ **LOWERCASE** = Huruf kecil semua karakter alfa
+ Mengganti hanya (at) (peka huruf besar/kecil) dengan simbol @
+ Menghapus semua spasi putih, di mana saja dalam nilai 
+ Menghapus semua yang ada di luar yang pertama `"<` `>"` jika ada

### Telepon
<a name="normalization-ML-defn-phone"></a>
+ **TRIM = Memangkas** spasi putih di depan dan di belakang
+ **REMOVE\$1ALL\$1NON\$1NUMERIC=Menghapus semua karakter non-numerik [0-9]**
+ **REMOVE\$1ALL\$1LEADING\$1ZEROES=Menghapus semua angka** nol di depan
+ **ENSURE\$1PREFIX\$1WITH\$1MAP, "phonePrefixMap"** = Memeriksa setiap nomor telepon dan mencoba mencocokkannya dengan pola di. phonePrefixMap Jika kecocokan ditemukan, aturan akan menambah atau mengubah awalan nomor telepon untuk memastikannya sesuai dengan format standar yang ditentukan dalam peta.

## One-to-One pencocokan
<a name="one-to-one-matching-defn"></a>

One-to-one pencocokan membandingkan contoh tunggal dari data serupa. Bidang input dengan kunci pencocokan yang sama dan nilai di bidang input yang sama akan dicocokkan satu sama lain. 

Misalnya, Anda mungkin memiliki beberapa kolom input nomor telepon seperti `mobile_phone` dan `home_phone` yang memiliki tombol kecocokan yang sama “Telepon”. Gunakan one-to-one pencocokan untuk membandingkan data di bidang `mobile_phone` input dengan data di bidang `mobile_phone` input dan untuk membandingkan data di bidang `home_phone` input dengan data di bidang `home_phone` input. Data di bidang `mobile_phone` input tidak akan dibandingkan dengan data di bidang `home_phone` input. 

Aturan pencocokan mengevaluasi data dalam beberapa bidang input dengan kunci pencocokan yang sama dengan operasi (atau), dan one-to-many pencocokan membandingkan nilai dalam satu bidang input. Ini berarti bahwa jika `mobile_phone` atau `home_phone` cocok antara dua catatan, tombol kecocokan “Telepon” akan mengembalikan kecocokan. Untuk tombol kecocokan “Telepon” untuk menemukan kecocokan, `Record One mobile_phone = Record Two mobile_phone` OR`Record One home_phone = Record Two home_phone`. 

Aturan pencocokan mengevaluasi data di bidang input dengan kunci pencocokan yang berbeda dengan operasi (dan). Jika Anda ingin pencocokan berbasis aturan mempertimbangkan berbagai jenis informasi nomor telepon secara terpisah, Anda dapat membuat kunci pencocokan yang lebih spesifik seperti “mobile\$1phone” dan “home\$1phone”. Jika Anda ingin menggunakan kedua tombol pencocokan dalam aturan untuk menemukan kecocokan, `Record One mobile_phone = Record Two mobile_phone` DAN`Record One home_phone = Record Two home_phone`.

## Output
<a name="output-defn"></a>

Daftar **OutputAttribute**objek, yang masing-masing memiliki bidang **Nama** dan **Hashed.** Masing-masing objek ini mewakili kolom yang akan disertakan dalam tabel AWS Glue output dan apakah Anda ingin nilai dalam kolom yang akan di-hash.

## Keluaran3Path
<a name="output-s3-path"></a>

Tujuan S3 yang Resolusi Entitas AWS akan menulis tabel output.

## OutputSourceConfig
<a name="output-source-config"></a>

**Daftar OutputSource objek, yang masing-masing memiliki bidang **outputs3Path,, **ApplyNormalization**dan Output**.**

## Pencocokan berbasis layanan penyedia
<a name="provider-service-matching"></a>

Pencocokan berbasis layanan penyedia adalah proses yang dirancang untuk mencocokkan, menautkan, dan menyempurnakan catatan Anda dengan penyedia layanan data pilihan dan kumpulan data berlisensi. Anda harus berlangganan melalui AWS Data Exchange layanan penyedia untuk menggunakan teknik pencocokan ini.

Resolusi Entitas AWS saat ini terintegrasi dengan penyedia layanan data berikut: 
+ LiveRamp
+ TransUnion
+ UID 2.0

## Pencocokan berbasis aturan
<a name="rule-based-matching-defn"></a>

Pencocokan berbasis aturan adalah proses yang dirancang untuk menemukan kecocokan yang tepat. Pencocokan berbasis aturan adalah seperangkat hierarkis aturan pencocokan air terjun, disarankan oleh Resolusi Entitas AWS, berdasarkan data yang Anda masukkan dan dapat dikonfigurasi sepenuhnya oleh Anda. Semua kunci pencocokan yang disediakan dalam kriteria aturan harus sama persis agar data yang dibandingkan dinyatakan cocok dan metadata terkait menjadi keluaran. Pencocokan berbasis aturan mengembalikan [ID Pencocokan](#match-id-defin) dan nomor aturan untuk setiap kumpulan data yang cocok.

Kami merekomendasikan mendefinisikan aturan yang dapat mengidentifikasi entitas secara unik. Pesan aturan Anda untuk menemukan kecocokan yang lebih tepat terlebih dahulu. 

Misalnya, katakanlah Anda memiliki dua aturan, **Aturan 1** dan **Aturan 2**.

Aturan-aturan ini memiliki kunci kecocokan berikut:
+ **Aturan 1** termasuk Nama Lengkap dan Alamat
+ **Aturan 2** mencakup Nama Lengkap, Alamat, dan Telepon

Karena **Aturan 1** berjalan lebih dulu, tidak ada kecocokan yang akan ditemukan oleh **Aturan 2** karena semuanya akan ditemukan oleh **Aturan 1**.

Untuk menemukan kecocokan yang dibedakan berdasarkan Telepon, susun ulang aturannya, seperti ini:
+ **Aturan 2** mencakup Nama Lengkap, Alamat, dan Telepon
+ **Aturan 1** termasuk Nama Lengkap dan Alamat

## Skema
<a name="schema-definition"></a>

Istilah yang digunakan untuk struktur atau tata letak yang mendefinisikan bagaimana satu set data diatur dan terhubung.

## Deskripsi skema
<a name="schema-description-defn"></a>

Deskripsi opsional skema yang dapat Anda pilih untuk dimasukkan. Deskripsi membantu Anda membedakan antara pemetaan skema jika Anda membuat lebih dari satu.

## Nama skema
<a name="schema-name-defn"></a>

Nama skema. 

**catatan**  
Nama skema harus unik. Mereka tidak dapat memiliki nama yang sama atau kesalahan akan dikembalikan.

## Pemetaan skema
<a name="schema-mapping-definition"></a>

Pemetaan skema Resolusi Entitas AWS adalah proses di mana Anda memberi tahu Resolusi Entitas AWS cara menafsirkan data Anda untuk pencocokan. Anda menentukan skema tabel data input yang ingin Anda baca Resolusi Entitas AWS ke dalam alur kerja yang cocok.

## Skema pemetaan ARN
<a name="schema-arn-defn"></a>

Nama Sumber Daya Amazon (ARN) yang dihasilkan untuk pemetaan [skema](#schema-mapping-definition).

## ID Unik
<a name="unique-id-defn"></a>

Pengidentifikasi unik yang Anda tentukan dan yang harus ditetapkan untuk setiap baris data masukan yang Resolusi Entitas AWS dibaca.

**Example**  
Misalnya: **Primary\$1key**, **Row\$1ID**, atau **Record\$1ID**.

Kolom **ID Unik** diperlukan.

 **ID Unik** harus berupa pengidentifikasi unik dalam satu tabel. 

**ID Unik** harus memenuhi pola ini: `[a-zA-Z0-9_-]`

Di berbagai tabel, **ID Unik** dapat memiliki nilai duplikat. 

Panjang **ID Unik** maksimum adalah 38 untuk [alur kerja yang cocok](#matching-workflow-definition)

Panjang **ID Unik** maksimum 257 karakter untuk [Alur kerja pemetaan ID](#id-mapping-workflow-defn)

Saat [alur kerja yang cocok](#matching-workflow-definition) dijalankan, record akan ditolak jika **Unique ID**:
+ tidak ditentukan
+ tidak unik dalam tabel yang sama
+ tumpang tindih dalam hal nama atribut di seluruh sumber
+ melebihi 38 karakter (hanya alur kerja pencocokan berbasis aturan)