

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# AWS Entity Resolution 詞彙表
<a name="glossary"></a>

## Amazon Resource Name (ARN)
<a name="arn-definition"></a>

 AWS 資源的唯一識別符。當您需要在所有 中明確指定資源時 AWS Entity Resolution，例如 AWS Entity Resolution 政策、Amazon Relational Database Service (Amazon RDS) 標籤和 API 呼叫，則需要 ARNs。

## 屬性類型
<a name="attribute-type-defn"></a>

輸入欄位的 屬性類型。當您[建立結構描述映射](create-schema-mapping.md)時，請從預先設定的值清單中選擇**屬性類型**，例如**名稱**、**地址**、**電話號碼**或**電子郵件地址**。屬性類型會告訴您要呈現 AWS Entity Resolution 哪些類型的資料，以便正確分類和標準化資料。

## 自動處理
<a name="incremental-processing"></a>

比對工作流程任務的處理節奏選項，可讓您在資料輸入變更時自動在 上執行。

此選項僅適用於[規則型比對](#rule-based-matching-defn)。

根據預設，相符工作流程任務的處理節奏會設為[**手動**](#manual-processing)，使其可隨需執行。您可以設定**自動**處理，以便在資料輸入變更時自動執行相符的工作流程任務。這可讓相符的工作流程輸出保持在up-to-date。

## AWS KMS key ARN
<a name="kms-arn-defn"></a>

這是用於靜態加密的 AWS KMS Amazon Resource Name (ARN)。如果未提供，系統將使用 AWS Entity Resolution 受管 KMS 金鑰。

## 批次工作流程
<a name="batch-defn"></a>

以排程間隔執行的程序，以比對和解析整個資料集的資料。中的批次工作流程 AWS Entity Resolution 最適合用於初始設定、定期完整重新整理，以及來源和目標資料集發生重大變更的情況。

## 純文字
<a name="cleartext-defn"></a>

未受到密碼編譯保護的資料。

## 可信度層級 ConfidenceLevel)
<a name="confidence-level-defn"></a>

對於 ML 比對，這是當 ML 識別相符的記錄集 AWS Entity Resolution 時， 套用的可信度等級。這是將包含在輸出中的[相符工作流程中繼資料](#matching-workflow-metadata)的一部分。

## 解密
<a name="decryption-defn"></a>

將加密資料轉換回原始格式的程序。只有在您可以存取私密金鑰時，才能執行解密。

## 加密
<a name="encryption-defn"></a>

將資料編碼為使用稱為金鑰之秘密值隨機顯示的形式的程序。無法在無法存取金鑰的情況下判斷原始純文字。

## Group name (群組名稱)
<a name="group-name-defn"></a>

**群組名稱**會參考整個輸入欄位群組，並可協助您將剖析的資料分組在一起以進行比對。

例如，如果有三個輸入欄位：**first\$1name**、 和 **last\$1name**，您可以將**群組名稱**輸入為 **full\$1name** 以進行比對和輸出**middle\$1name**，將它們分組在一起。

## 雜湊
<a name="hash-defn"></a>

雜湊表示套用密碼編譯演算法，該演算法會產生固定大小不可復原且唯一的字元字串，稱為 hash. AWS Entity Resolution uses Secure Hash Algorithm 256 位元 (SHA256) 雜湊通訊協定，並將輸出 32 位元組字元字串。在 中 AWS Entity Resolution，您可以選擇是否要在輸出中雜湊資料值。

## 雜湊通訊協定 HashingProtocol)
<a name="hash-protocol-defn"></a>

AWS Entity Resolution 使用安全雜湊演算法 256 位元 (SHA256) 雜湊通訊協定，並將輸出 32 位元組字元字串。這是將包含在輸出中的[相符工作流程中繼資料](#matching-workflow-metadata)的一部分。

## ID 映射方法
<a name="id-mapping-method-defn"></a>

您希望 ID 映射如何執行。

有兩種 ID 映射方法：
+ 規則型 – 使用相符規則將來源的第一方資料轉譯為 ID 映射工作流程中目標的方法。
+ 提供者服務 – 您使用提供者服務將第三方編碼資料從來源轉譯到 ID 映射工作流程中目標的方法。

  AWS Entity Resolution 目前支援 LiveRamp 做為提供者服務型 ID 映射方法。您必須透過 訂閱 LiveRamp， AWS Data Exchange 才能使用此方法。如需詳細資訊，請參閱[步驟 1：在 上訂閱提供者服務 AWS Data Exchange](prepare-third-party-input-data.md#subscribe-provider-service)。

## ID 映射工作流程
<a name="id-mapping-workflow-defn"></a>

根據指定的 ID 映射方法，將資料從輸入資料來源映射到輸入資料目標的資料處理任務。它會產生 ID 映射表。此工作流程需要您指定 [ID 映射方法](#id-mapping-method-defn)，以及您要從來源轉譯到目標的輸入資料。

您可以設定 ID 映射工作流程，在您自己的 中 AWS 帳戶 或跨兩個 執行 AWS 帳戶。

## ID 命名空間
<a name="id-namespace-defn"></a>

中的資源 AWS Entity Resolution ，其中包含說明多個 AWS 帳戶 資料集的中繼資料，以及如何在 [ID 映射工作流程](#id-mapping-workflow-defn)中使用這些資料集。

ID 命名空間有兩種類型： `SOURCE`和 `TARGET`。`SOURCE` 包含將在 ID 映射工作流程中處理的來源資料的組態。`TARGET` 包含所有來源將解析的目標資料的組態。若要定義要跨兩個 解析的輸入資料 AWS 帳戶，請建立 ID 命名空間來源和 ID 命名空間目標，將您的資料從一組 (`SOURCE`) 轉譯為另一組 ()`TARGET`。

在您和另一個成員建立 ID 命名空間並執行 ID 映射工作流程之後，您可以在 中加入協同合作 AWS Clean Rooms ，以在 ID 映射資料表上執行多資料表聯結，並分析資料。

如需詳細資訊，請參閱[「AWS Clean Rooms 使用者指南」](https://docs.aws.amazon.com/clean-rooms/latest/userguide/what-is.html)。

## 增量工作流程
<a name="incremental-defn"></a>

只比對並解析自上次執行以來新增或更新記錄的程序，而不是處理整個資料集。中的增量工作流程 AWS Entity Resolution 最適合用於頻繁更新，以在資料集只有一小部分變更時維持資料新鮮度。

## 輸入欄位
<a name="input-field-defn"></a>

輸入欄位對應至 AWS Glue 輸入資料表中的資料欄名稱。

## 輸入來源 ARN (InputSourceARN)
<a name="input-source-arn-defn"></a>

為 AWS Glue 資料表輸入產生的 Amazon Resource Name (ARN)。這是將包含在輸出中的[相符工作流程中繼資料](#matching-workflow-metadata)的一部分。

## 機器學習型比對
<a name="ml-matching-defn"></a>

機器學習型比對 (ML 比對） 會在您的資料中找到可能不完整或看起來不完全相同的比對。ML 比對是一種預設程序，會嘗試比對您輸入所有資料的記錄。ML 比對會傳回每組相符資料的[比對 ID](#match-id-defin) 和[可信度。](#confidence-level-defn)

## 手動處理
<a name="manual-processing"></a>

比對工作流程任務的處理節奏選項，可隨需執行。

此選項預設為 ，可用於[規則型比對](#rule-based-matching-defn)和[機器學習型比對](#ml-matching-defn)。

## Many-to-Many比對
<a name="many-to-many-defin"></a>

Many-to-many比對會比較類似資料的多個執行個體。已指派相同相符索引鍵的輸入欄位中的值會彼此比對，無論它們位於相同的輸入欄位或不同的輸入欄位。

例如，您可能有多個電話號碼輸入欄位`home_phone`，例如 `mobile_phone`和具有相同相符索引鍵「Phone」。使用many-to-many比對，將`mobile_phone`輸入欄位中的資料與`mobile_phone`輸入欄位中的資料和`home_phone`輸入欄位中的資料進行比較。

比對規則會使用與 （或） 操作相同的比對索引鍵評估多個輸入欄位中的資料，而one-to-many比對則會比較多個輸入欄位的值。這表示如果兩個記錄之間有任何 `mobile_phone`或 的組合`home_phone`相符，「電話」相符金鑰將傳回相符項目。針對配對金鑰「電話」尋找配對，`Record One mobile_phone = Record Two mobile_phone`或 `Record One mobile_phone = Record Two home_phone` OR `Record One home_phone = Record Two home_phone` 或 `Record One home_phone = Record Two mobile_phone`。

## 比對 ID (MatchID)
<a name="match-id-defin"></a>

對於規則型比對和 ML 比對，這是由 產生 AWS Entity Resolution 並套用至每個比對記錄集的 ID。這是將包含在輸出中的[相符工作流程中繼資料](#matching-workflow-metadata)的一部分。

## 比對金鑰 (MatchKey)
<a name="match-key-defn"></a>

比對索引鍵會指示要將 AWS Entity Resolution 哪些輸入欄位視為類似資料，以及要將哪些輸入欄位視為不同資料。這有助於 AWS Entity Resolution 自動設定規則型比對規則，並比較儲存在不同輸入欄位中的類似資料。

如果資料中有多個電話號碼資訊類型，例如`mobile_phone`輸入欄位和您想要比較在一起的`home_phone`輸入欄位，您可以為他們提供配對金鑰「Phone」。然後，您可以將規則型比對設定為使用「或」陳述式，在所有輸入欄位中將資料與「電話」比對金鑰進行比較 （請參閱配對工作流程中的[One-to-One比對](#one-to-one-matching-defn)和[Many-to-Many](#many-to-many-defin)比對定義一節）。

如果您希望規則型比對完全分開考慮不同類型的電話號碼資訊，您可以建立更具體的比對金鑰，例如「Mobile\$1Phone」和「Home\$1Phone」。然後，設定相符的工作流程時，您可以指定每個電話比對金鑰在規則型比對中的使用方式。

如果未針對特定輸入欄位指定 MatchKey，則無法用於相符項目，但可以透過相符的工作流程程序進行，並視需要輸出。

## 比對金鑰名稱
<a name="match-key-name-defn"></a>

指派給相符金鑰的名稱。

## 比對規則 (MatchRule)
<a name="match-rule-defn"></a>

對於規則型比對，這是產生相符記錄集的套用規則號碼。這是將包含在輸出中的[相符工作流程中繼資料](#matching-workflow-metadata)的一部分。

## 相符
<a name="matching-definition"></a>

結合和比較來自不同輸入欄位、資料表或資料庫的資料，並根據滿足特定相符條件 （例如，透過相符規則或模型） 來判斷哪些資料相似或「相符」的程序。

## 比對工作流程
<a name="matching-workflow-definition"></a>

您設定以指定要比對的輸入資料，以及如何執行比對的程序。

## 比對工作流程描述
<a name="matching-workflow-description"></a>

您可以選擇輸入的相符工作流程的選用描述。如果您建立多個工作流程，描述可協助您區分相符的工作流程。

## 相符的工作流程名稱
<a name="matching-workflow-name"></a>

您指定的相符工作流程名稱。

**注意**  
相符的工作流程名稱必須是唯一的。它們不能有相同的名稱，否則將會傳回錯誤。

## 比對工作流程中繼資料
<a name="matching-workflow-metadata"></a>

在相符工作流程任務 AWS Entity Resolution 期間由 產生和輸出的資訊。輸出時需要此資訊。

## 標準化 (ApplyNormalization)
<a name="normalization-defn"></a>

選擇是否要標準化結構描述中定義的輸入資料。標準化透過移除額外的空格和特殊字元來標準化資料，並將 標準化為小寫格式。

例如，如果輸入欄位的屬性類型為[完整電話](#normalization-rule-phone)，且輸入資料表中的值格式為 `(123) 456-7890`，則 AWS Entity Resolution 會將值標準化為 `1234567890`。

**注意**  
僅支援[名稱](#normalization-rule-name)、[地址](#normalization-rule-address)、[電話](#normalization-rule-phone)和[電子郵件](#normalization-rule-email)的群組類型標準化。

下列各節說明我們的標準標準化規則。

如需 ML 型配對的詳細資訊，請參閱 [標準化 (ApplyNormalization) – 僅限 ML](#normalization-ML-defn)。

**Topics**
+ [名稱](#normalization-rule-name)
+ [Email](#normalization-rule-email)
+ [Phone](#normalization-rule-phone)
+ [地址](#normalization-rule-address)
+ [雜湊](#normalization-rule-hashed)
+ [Source\$1ID](#normalization-rule-source-id)

### 名稱
<a name="normalization-rule-name"></a>

**注意**  
只有**名稱**群組類型支援標準化。  
**名稱**群組類型會在主控台中顯示為**全名**，並在 API `NAME`中顯示為 。  
如果您想要標準化**名稱**群組類型的子類型：  
在 主控台中，將下列子類型指派給**全名**群組：**名字**、**中間名**和**姓氏**。
在 [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html) API 中，將下列**類型**指派給 `NAME` **groupName**：`NAME_FIRST`、 `NAME_MIDDLE`和 `NAME_LAST`。
+ **TRIM** = 修剪前後空格
+ **LOWERCASE** = 小寫所有字母字元
+ **CONVERT\$1ACCENT** = 將重音字母轉換為一般字母
+ **REMOVE\$1ALL\$1NON\$1ALPHA **= 移除所有非字母字元 【a-zA-Z】

### Email
<a name="normalization-rule-email"></a>

**注意**  
**電子郵件**群組類型支援標準化。  
**電子郵件**群組類型會在 主控台中顯示為**電子郵件地址**，並在 API `EMAIL_ADDRESS`中顯示為 。
+ **TRIM **= 修剪前後空格
+ **LOWERCASE** = 小寫所有字母字元
+ **CONVERT\$1ACCENT** = 將重音字母轉換為一般字母
+ **EMAIL\$1ADDRESS\$1UTIL\$1NORM** = 從使用者名稱中移除任何點 (.)、移除使用者名稱中加號 (＋) 之後的任何內容，並標準化常見的網域變化
+ **REMOVE\$1ALL\$1NON\$1EMAIL\$1CHARS **= 移除所有non-alpha-numeric【a-zA-Z0-9】 和 【.@-】

### Phone
<a name="normalization-rule-phone"></a>

**注意**  
僅支援**電話**群組類型的標準化。  
**電話**群組類型會在主控台中顯示為**完整電話**，並在 API `PHONE`中顯示為 。  
如果您想要標準化**電話**群組類型的子類型：  
在 主控台中，將下列子類型指派給**完整電話號碼**群組：**電話號碼**和**電話國家/地區代碼**。
在 [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html) API 中，將下列**類型**指派給 `PHONE` **groupName**： `PHONE_NUMBER`和 `PHONE_COUNTRYCODE`。
+ **TRIM** = 修剪前後空格
+ **REMOVE\$1ALL\$1NON\$1NUMERIC** = 移除所有非數字字元 【0-9】
+ **REMOVE\$1ALL\$1LEADING\$1ZEROES** = 移除所有前導零
+ **ENsure\$1PREFIX\$1WITH\$1MAP， "phonePrefixMap"** = 檢查每個電話號碼，並嘗試比對其與 phonePrefixMap 中的模式。如果找到相符項目，規則會新增或修改電話號碼的字首，以確保符合地圖中指定的標準化格式。

### 地址
<a name="normalization-rule-address"></a>

**注意**  
只有**地址**群組類型才支援標準化。  
**地址**群組類型會在主控台中顯示為**完整地址**，並在 API `ADDRESS `中顯示為 。  
如果您想要標準化**地址**群組類型的子類型：  
在 主控台中，將下列子類型指派給**完整地址**群組：**街道地址 1**、**街道地址 2**：**街道地址 3 名稱**、**城市名稱**、**州**、**國家**/地區和**郵遞區號** t
在 [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html) API 中，將下列**類型**指派給 `ADDRESS` **groupName**：`ADDRESS_STREET1`、`ADDRESS_STREET2`、`ADDRESS_STREET3`、`ADDRESS_STATE`、 `ADDRESS_CITY` `ADDRESS_COUNTRY`和 `ADDRESS_POSTALCODE`。
+ **TRIM** = 修剪前後空格
+ **LOWERCASE** = 小寫所有字母字元
+ **CONVERT\$1ACCENT** = 將重音字母轉換為一般字母
+ **REMOVE\$1ALL\$1NON\$1ALPHA **= 移除所有非字母字元 【a-zA-Z】
+ **使用 ADDRESS\$1RENAME\$1WORD\$1MAP 的 RENAME\$1WORDS** = 使用[來自 ADDRESS\$1RENAME\$1WORD\$1MAP](#ADDRESS_RENAME_WORD_MAP) 的單字取代地址字串中的單字
+ **使用 ADDRESS\$1RENAME\$1DELIMITER\$1MAP 的 RENAME\$1DELIMITERS** = 使用[來自 ADDRESS\$1RENAME\$1DELIMITER\$1MAP](#ADDRESS_RENAME_DELIMITER_MAP) 的字串取代地址字串中的分隔符號
+ **使用 ADDRESS\$1RENAME\$1DIRECTION\$1MAP= 的 RENAME\$1DIRECTIONS** 使用 [ADDRESS\$1RENAME\$1DIRECTION\$1MAP](#ADDRESS_RENAME_DIRECTION_MAP) 的字串取代地址字串中的分隔符號
+ **使用 ADDRESS\$1RENAME\$1NUMBER\$1MAP 的 RENAME\$1NUMBERS** = 使用來自 [ADDRESS\$1RENAME\$1NUMBER\$1MAP](#ADDRESS_RENAME_NUMBER_MAP.title) 的字串取代地址字串中的數字
+ **使用 ADDRESS\$1RENAME\$1SPECIAL\$1CHAR\$1MAP 的 RENAME\$1SPECIAL\$1CHARS** = 使用來自 [ADDRESS\$1RENAME\$1SPECIAL\$1CHAR\$1MAP](#ADDRESS_RENAME_SPECIAL_CHAR_MAP.title) 的字串取代地址字串中的特殊字元

#### ADDRESS\$1RENAME\$1WORD\$1MAP
<a name="ADDRESS_RENAME_WORD_MAP"></a>

這些是標準化地址字串時將重新命名的字詞。

```
"avenue": "ave",
 "bouled": "blvd",
 "circle": "cir",
 "circles": "cirs",
 "court": "ct",
 "centre": "ctr",
 "center": "ctr",
 "drive": "dr",
 "freeway": "fwy",
 "frwy": "fwy",
 "highway": "hwy",
 "lane": "ln",
 "parks": "park",
 "parkways": "pkwy",
 "pky": "pkwy",
 "pkway": "pkwy",
 "pkwys": "pkwy",
 "parkway": "pkwy",
 "parkwy": "pkwy",
 "place": "pl",
 "plaza": "plz",
 "plza": "plz",
 "road": "rd",
 "square": "sq",
 "squ": "sq",
 "sqr": "sq",
 "street": "st",
 "str": "st",
 "str.": "strasse"
```

#### ADDRESS\$1RENAME\$1DELIMITER\$1MAP
<a name="ADDRESS_RENAME_DELIMITER_MAP"></a>

這些是標準化地址字串時將重新命名的分隔符號。

```
",": " ",
".": " ",
"[": " ",
"]": " ",
"/": " ",
"-": " ",
"#": " number "
```

#### ADDRESS\$1RENAME\$1DIRECTION\$1MAP
<a name="ADDRESS_RENAME_DIRECTION_MAP"></a>

這些是標準化地址字串時將重新命名的方向識別符。

```
"east": "e",
"north": "n",
"south": "s",
"west": "w",
"northeast": "ne",
"northwest": "nw",
"southeast": "se",
"southwest": "sw"
```

#### ADDRESS\$1RENAME\$1NUMBER\$1MAP
<a name="ADDRESS_RENAME_NUMBER_MAP"></a>

這些是在標準化地址字串時將重新命名的數字字串。

```
"número": "number",
 "numero": "number",
 "no": "number",
 "núm": "number",
 "num": "number"
```

#### ADDRESS\$1RENAME\$1SPECIAL\$1CHAR\$1MAP
<a name="ADDRESS_RENAME_SPECIAL_CHAR_MAP"></a>

這些是特殊字元字串，會在標準化地址字串時重新命名。

```
"ß": "ss",
 "ä": "ae",
 "ö": "oe",
 "ü": "ue",
 "ø": "o",
 "æ": "ae"
```

### 雜湊
<a name="normalization-rule-hashed"></a>
+ **TRIM** = 修剪前後空格

### Source\$1ID
<a name="normalization-rule-source-id"></a>
+ **TRIM** = 修剪前後空格

## 標準化 (ApplyNormalization) – 僅限 ML
<a name="normalization-ML-defn"></a>

選擇是否要標準化結構描述中定義的輸入資料。標準化透過移除額外的空格和特殊字元來標準化資料，並將 標準化為小寫格式。

例如，如果輸入欄位的屬性類型為 `NAME`，且輸入資料表中的值格式為 `Johns Smith`，則 AWS Entity Resolution 會將值標準化為 `john smith`。

下列各節說明[機器學習型比對工作流程](#ml-matching-defn)的標準化規則。

**Topics**
+ [名稱](#normalization-ML-defn-name)
+ [Email](#normalization-ML-defn-email)
+ [Phone](#normalization-ML-defn-phone)

### 名稱
<a name="normalization-ML-defn-name"></a>
+ **TRIM** = 修剪前後空格
+ **LOWERCASE** = 小寫所有字母字元

### Email
<a name="normalization-ML-defn-email"></a>
+ **LOWERCASE** = 小寫所有字母字元
+ 僅以 @ 符號取代 （區分大小寫）
+ 移除值中的任何位置的所有空格 
+ `"<` `>"` 如果存在，則移除在第一個 外部的所有項目

### Phone
<a name="normalization-ML-defn-phone"></a>
+ **TRIM** = 修剪前後空格
+ **REMOVE\$1ALL\$1NON\$1NUMERIC** = 移除所有非數字字元 【0-9】
+ **REMOVE\$1ALL\$1LEADING\$1ZEROES** = 移除所有前導零
+ **ENsure\$1PREFIX\$1WITH\$1MAP， "phonePrefixMap"** = 檢查每個電話號碼，並嘗試比對其與 phonePrefixMap 中的模式。如果找到相符項目，規則會新增或修改電話號碼的字首，以確保符合地圖中指定的標準化格式。

## One-to-One比對
<a name="one-to-one-matching-defn"></a>

One-to-one比對會比較類似資料的單一執行個體。相同輸入欄位中具有相同相符索引鍵和值的輸入欄位將彼此相符。

例如，您可能有多個電話號碼輸入欄位`home_phone`，例如 `mobile_phone`和具有相同相符索引鍵「Phone」。使用one-to-one比對來比較`mobile_phone`輸入欄位中的資料與`mobile_phone`輸入欄位中的資料，以及比較`home_phone`輸入欄位中的資料與`home_phone`輸入欄位中的資料。`mobile_phone` 輸入欄位中的資料不會與`home_phone`輸入欄位中的資料進行比較。

比對規則會使用與 （或） 操作相同的比對索引鍵評估多個輸入欄位中的資料，而one-to-many比對則會比較單一輸入欄位中的值。這表示如果兩個記錄之間有 `mobile_phone`或 `home_phone` 相符，則「電話」相符金鑰會傳回相符項目。對於配對金鑰「電話」來尋找配對，`Record One mobile_phone = Record Two mobile_phone`或 `Record One home_phone = Record Two home_phone`。

比對規則會使用 （和） 操作評估具有不同比對索引鍵的輸入欄位中的資料。如果您希望規則型比對完全分開考慮不同類型的電話號碼資訊，您可以建立更具體的比對金鑰，例如「mobile\$1phone」和「home\$1phone」。如果您想要在規則中使用兩個相符索引鍵來尋找相符項目， `Record One mobile_phone = Record Two mobile_phone` AND `Record One home_phone = Record Two home_phone`。

## Output
<a name="output-defn"></a>

**OutputAttribute** 物件的清單，每個物件都有欄位**名稱**和**雜湊**。這些物件都代表要包含在 AWS Glue 輸出資料表中的資料欄，以及是否要雜湊資料欄中的值。

## OutputS3Path
<a name="output-s3-path"></a>

 AWS Entity Resolution 將寫入輸出資料表的 S3 目的地。

## OutputSourceConfig
<a name="output-source-config"></a>

OutputSource 物件的清單，每個物件都有 **OutputS3Path**、**ApplyNormalization** 和 **Output** 欄位。

## 供應商服務型比對
<a name="provider-service-matching"></a>

以提供者服務為基礎的比對程序，旨在透過偏好的資料服務提供者和授權的資料集來比對、連結和增強您的記錄。您必須透過 AWS Data Exchange 與提供者服務進行訂閱，才能使用此相符技術。

AWS Entity Resolution 目前與下列資料服務提供者整合：
+ LiveRamp
+ TransUnion
+ UID 2.0

## 規則型比對
<a name="rule-based-matching-defn"></a>

規則型比對是旨在尋找完全比對的程序。規則型比對是一套階層式的瀑布比對規則，由 根據您輸入的資料建議 AWS Entity Resolution，且由您完全設定。規則條件內提供的所有相符金鑰都必須完全相符，才能宣告相符的比較資料，以及輸出相關聯的中繼資料。規則型比對會傳回[相符 ID](#match-id-defin) 和每個相符資料集的規則編號。

我們建議定義可唯一識別實體的規則。排序您的規則，先尋找更精確的相符項目。

例如，假設您有兩個規則：**規則 1** 和**規則 2**。

這些規則具有下列相符金鑰：
+ **規則 1** 包含全名和地址
+ **規則 2** 包含全名、地址和電話

由於**規則 1** 會先執行，因此**規則 2** 找不到相符項目，因為規則 **1** 會找到這些相符項目。

若要尋找以電話區分的相符項目，請重新排序規則，如下所示：
+ **規則 2** 包含全名、地址和電話
+ **規則 1** 包含全名和地址

## 結構描述
<a name="schema-definition"></a>

用於定義資料集如何組織和連線的結構或配置的術語。

## 結構描述描述
<a name="schema-description-defn"></a>

您可以選擇輸入的結構描述的選用描述。如果您建立多個結構描述映射，描述可協助您區分。

## 結構描述名稱
<a name="schema-name-defn"></a>

結構描述的名稱。

**注意**  
結構描述名稱必須是唯一的。它們不能有相同的名稱，否則將會傳回錯誤。

## 結構描述映射
<a name="schema-mapping-definition"></a>

中的結構描述映射 AWS Entity Resolution 是您告知 AWS Entity Resolution 如何解譯資料以進行比對的程序。您可以定義 AWS Entity Resolution 要讀取至相符工作流程的輸入資料表結構描述。

## 結構描述映射 ARN
<a name="schema-arn-defn"></a>

為[結構描述映射](#schema-mapping-definition)產生的 Amazon Resource Name (ARN)。

## 唯一 ID
<a name="unique-id-defn"></a>

您指定且必須指派給讀取之每一列輸入資料的唯一識別符 AWS Entity Resolution 。

**Example**  
例如，**Primary\$1key**、**Row\$1ID** 或 **Record\$1ID**。

**唯一 ID** 欄為必要欄位。

 **唯一 ID** 必須是單一資料表內的唯一識別符。

**唯一 ID ** 必須滿足此模式： `[a-zA-Z0-9_-]`

在不同資料表中，**唯一 ID** 可以有重複的值。

[相符工作流程](#matching-workflow-definition)**的唯一 ID ** 長度上限為 38

的最大**唯一 ID ** 長度為 257 個字元 [ID 映射工作流程](#id-mapping-workflow-defn)

執行[相符的工作流程](#matching-workflow-definition)時，如果**唯一 ID**：
+ 未指定
+ 在同一資料表中不是唯一的
+ 跨來源屬性名稱重疊
+ 超過 38 個字元 （僅限規則型相符工作流程）