

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Résolution des entités AWS Glossaire
<a name="glossary"></a>

## Amazon Resource Name (ARN)
<a name="arn-definition"></a>

Identifiant unique pour les AWS ressources. ARNs sont nécessaires lorsque vous devez spécifier une ressource sans ambiguïté dans l'ensemble, par exemple dans les Résolution des entités AWS politiques Résolution des entités AWS, les balises Amazon Relational Database Service (Amazon RDS) et les appels d'API.

## Type d'attribut
<a name="attribute-type-defn"></a>

Type d'attribut pour le champ de saisie. Lorsque vous [créez un mappage de schéma](create-schema-mapping.md), vous sélectionnez le **type d'attribut** dans une liste préconfigurée de valeurs telles que le **nom**, l'**adresse**, le **numéro de téléphone** ou l'**adresse e-mail**. Le type d'attribut indique Résolution des entités AWS le type de données que vous présentez, ce qui permet de les classer et de les normaliser correctement.

## Traitement automatique
<a name="incremental-processing"></a>

Une option de cadence de traitement pour une tâche de flux de travail correspondante qui permet de l'exécuter automatiquement lorsque votre saisie de données change. 

Cette option n'est disponible que pour le [rapprochement basé sur des règles](#rule-based-matching-defn).

Par défaut, la cadence de traitement d'une tâche de flux de travail correspondante est définie sur [**Manuel**](#manual-processing), ce qui permet de l'exécuter à la demande. Vous pouvez configurer le traitement **automatique** pour exécuter automatiquement la tâche de flux de travail correspondante lorsque votre saisie de données change. Cela permet de conserver le résultat correspondant à votre flux de travail up-to-date.

## AWS KMS key ARN
<a name="kms-arn-defn"></a>

Il s'agit de votre AWS KMS Amazon Resource Name (ARN) pour le chiffrement au repos. Si elle n'est pas fournie, le système utilisera une clé KMS Résolution des entités AWS gérée.

## Flux de travail par lots
<a name="batch-defn"></a>

Processus qui s'exécute à intervalles planifiés pour faire correspondre et résoudre les données d'un ensemble de données complet. Il est préférable d'utiliser Résolution des entités AWS les flux de travail par lots dans le cadre de la configuration initiale, des actualisations complètes périodiques et des scénarios impliquant des modifications importantes dans les ensembles de données source et cible.

## Texte clair
<a name="cleartext-defn"></a>

Données qui ne sont pas protégées par cryptographie.

## Niveau de confiance (ConfidenceLevel)
<a name="confidence-level-defn"></a>

Pour la correspondance ML, il s'agit du niveau de confiance appliqué Résolution des entités AWS lorsque ML identifie un ensemble d'enregistrements correspondants. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Déchiffrement
<a name="decryption-defn"></a>

Le processus qui consiste à remettre les données chiffrées dans leur forme d'origine. Le déchiffrement ne peut être effectué que si vous avez accès à la clé secrète.

## Chiffrement
<a name="encryption-defn"></a>

Processus consistant à coder des données sous une forme qui semble aléatoire à l'aide d'une valeur secrète appelée clé. Il est impossible de déterminer le texte brut d'origine sans accéder à la clé.

## Nom du groupe
<a name="group-name-defn"></a>

Le **nom du groupe** fait référence à l'ensemble des champs de saisie et peut vous aider à regrouper les données analysées à des fins de correspondance.

Par exemple, s'il existe trois champs de saisie : **first\$1name****middle\$1name**, et**last\$1name**, vous pouvez les regrouper en saisissant le **nom du groupe** comme **full\$1name** pour la correspondance et la sortie.

## Hachage
<a name="hash-defn"></a>

Le hachage consiste à appliquer un algorithme cryptographique qui produit une chaîne de caractères unique et irréversible de taille fixe, appelée hachage. Résolution des entités AWS utilise le protocole de hachage 256 bits (SHA256) de l'algorithme de hachage sécurisé et produira une chaîne de caractères de 32 octets. Dans Résolution des entités AWS, vous pouvez choisir de hacher ou non les valeurs des données dans votre sortie.

## Protocole de hachage () HashingProtocol
<a name="hash-protocol-defn"></a>

Résolution des entités AWS utilise le protocole de hachage 256 bits (SHA256) de l'algorithme de hachage sécurisé et produira une chaîne de caractères de 32 octets. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Méthode de mappage des ID
<a name="id-mapping-method-defn"></a>

Comment souhaitez-vous que le mappage des identifiants soit effectué. 

Il existe deux méthodes de mappage des identifiants : 
+ Basée sur des règles : méthode par laquelle vous utilisez des règles de correspondance pour traduire des données de première partie d'une source vers une cible dans un flux de travail de mappage d'identifiants.
+ Services du fournisseur : méthode par laquelle vous utilisez un service fournisseur pour traduire des données codées par des tiers d'une source vers une cible dans un flux de travail de mappage d'identifiants.

  Résolution des entités AWS est actuellement prise en charge en LiveRamp tant que méthode de mappage d'identifiants basée sur les services des fournisseurs. Vous devez être abonné à LiveRamp through AWS Data Exchange pour utiliser cette méthode. Pour de plus amples informations, veuillez consulter [Étape 1 : Abonnez-vous à un service fournisseur sur AWS Data Exchange](prepare-third-party-input-data.md#subscribe-provider-service).

## Workflow de mappage des identifiants
<a name="id-mapping-workflow-defn"></a>

Une tâche de traitement de données qui mappe les données d'une source de données d'entrée vers une cible de données d'entrée en fonction de la méthode de mappage d'ID spécifiée. Il produit une table de mappage des identifiants. Ce flux de travail vous oblige à spécifier la [méthode de mappage des identifiants](#id-mapping-method-defn) et les données d'entrée que vous souhaitez traduire d'une source vers une cible. 

Vous pouvez configurer un flux de travail de mappage d'identifiants pour qu'il s'exécute seul Compte AWS ou en deux Comptes AWS.

## Espace de noms ID
<a name="id-namespace-defn"></a>

Une ressource Résolution des entités AWS qui contient des métadonnées expliquant les ensembles de données sur plusieurs Comptes AWS et expliquant comment utiliser ces ensembles de données dans un flux de travail de [mappage d'identifiants](#id-mapping-workflow-defn).

Il existe deux types d'espaces de noms d'ID : `SOURCE` et`TARGET`. `SOURCE`Contient des configurations pour les données sources qui seront traitées dans un flux de travail de mappage d'identifiants. `TARGET`Contient une configuration des données cibles vers laquelle toutes les sources seront résolues. Pour définir les données d'entrée que vous souhaitez résoudre entre deux Comptes AWS, créez une source d'espace de noms ID et une cible d'espace de noms ID pour traduire vos données d'un ensemble (`SOURCE`) à un autre (). `TARGET`

Une fois que vous et un autre membre avez créé des espaces de noms d'identification et exécuté un flux de travail de mappage d'identifiants, vous pouvez rejoindre une collaboration AWS Clean Rooms pour exécuter une jointure multitable sur la table de mappage d'identifiants et analyser les données.

Pour plus d’informations, consultez le [Guide de l’utilisateur AWS Clean Rooms](https://docs.aws.amazon.com/clean-rooms/latest/userguide/what-is.html).

## Flux de travail incrémentiel
<a name="incremental-defn"></a>

Processus qui met uniquement en correspondance et résout les enregistrements nouveaux ou mis à jour depuis la dernière exécution, plutôt que de traiter l'ensemble de données dans son intégralité. Les flux de travail incrémentiels Résolution des entités AWS sont mieux utilisés pour les mises à jour fréquentes afin de maintenir l'actualité des données lorsque seule une petite partie du jeu de données a changé.

## Champ de saisie
<a name="input-field-defn"></a>

Un champ de saisie correspond au nom d'une colonne de votre table de données AWS Glue d'entrée.

## ARN de la source d'entrée (InputSourceARN)
<a name="input-source-arn-defn"></a>

Le nom de ressource Amazon (ARN) qui a été généré pour une entrée de AWS Glue table. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Correspondance basée sur le machine learning
<a name="ml-matching-defn"></a>

La mise en correspondance basée sur l'apprentissage automatique (ML matching) permet de trouver des correspondances entre vos données qui peuvent être incomplètes ou ne pas avoir exactement la même apparence. La correspondance ML est un processus prédéfini qui tentera de faire correspondre les enregistrements de toutes les données que vous entrez. La correspondance ML renvoie un [ID de correspondance](#match-id-defin) et un [niveau de confiance](#confidence-level-defn) pour chaque ensemble de données correspondant.

## Traitement manuel
<a name="manual-processing"></a>

Option de cadence de traitement pour une tâche de flux de travail correspondante qui permet de l'exécuter à la demande. 

Cette option est définie par défaut et est disponible à la fois pour la correspondance basée sur des [règles et pour la correspondance basée](#rule-based-matching-defn) [sur l'apprentissage automatique](#ml-matching-defn).

## Many-to-Many appariement
<a name="many-to-many-defin"></a>

Many-to-many matching compare plusieurs instances de données similaires. Les valeurs des champs de saisie auxquels la même clé de correspondance a été attribuée seront comparées les unes aux autres, qu'elles se trouvent dans le même champ de saisie ou dans des champs de saisie différents. 

Par exemple, vous pouvez avoir plusieurs champs de saisie de numéros de téléphone, tels `home_phone` que `mobile_phone` et qui ont la même touche de correspondance « Téléphone ». Utilisez la mise en many-to-many correspondance pour comparer les données du champ de `mobile_phone` saisie aux données du champ de `mobile_phone` saisie et aux données du champ de `home_phone` saisie. 

Les règles de correspondance évaluent les données de plusieurs champs de saisie avec la même clé de correspondance à l'aide d'une opération (ou), et le one-to-many rapprochement compare les valeurs entre plusieurs champs de saisie. Cela signifie que si une combinaison `mobile_phone` ou une `home_phone` correspondance entre deux enregistrements, la touche de correspondance « Téléphone » renverra une correspondance. Pour la touche de correspondance « Téléphone » pour trouver une correspondance, `Record One mobile_phone = Record Two mobile_phone` OU `Record One mobile_phone = Record Two home_phone` OU `Record One home_phone = Record Two home_phone` OU`Record One home_phone = Record Two mobile_phone`.

## Identifiant du match (MatchID)
<a name="match-id-defin"></a>

Pour la correspondance basée sur des règles et la correspondance ML, il s'agit de l'ID généré Résolution des entités AWS et appliqué à chaque ensemble d'enregistrements appariés. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Clé de correspondance (MatchKey)
<a name="match-key-defn"></a>

La touche Match indique les Résolution des entités AWS champs de saisie à considérer comme des données similaires et ceux à considérer comme des données différentes. Cela permet de configurer Résolution des entités AWS automatiquement des règles de correspondance basées sur des règles et de comparer des données similaires stockées dans différents champs de saisie. 

S'il existe plusieurs types d'informations de numéro de téléphone, comme un `mobile_phone` champ de `home_phone` saisie et un champ de saisie dans vos données, vous pouvez leur attribuer la touche correspondante « Téléphone ». [La correspondance basée sur des règles peut ensuite être configurée pour comparer les données à l'aide des instructions « ou » dans tous les champs de saisie avec la touche de correspondance « Téléphone » (voir les définitions de [One-to-One correspondance et Many-to-Many de correspondance](#one-to-one-matching-defn) dans la section Matching Workflow).](#many-to-many-defin) 

Si vous souhaitez que la correspondance basée sur des règles prenne en compte les différents types d'informations de numéro de téléphone de manière complètement séparée, vous pouvez créer des clés de correspondance plus spécifiques, telles que « Mobile\$1Phone » et « Home\$1Phone ». Ensuite, lors de la configuration d'un flux de travail de correspondance, vous pouvez spécifier comment chaque touche de correspondance téléphonique sera utilisée dans le cadre de la correspondance basée sur des règles. 

Si non MatchKey est spécifié pour un champ de saisie particulier, il ne peut pas être utilisé pour la mise en correspondance mais peut être effectué tout au long du processus de correspondance et peut être sorti si vous le souhaitez.

## Nom de la clé de correspondance
<a name="match-key-name-defn"></a>

Le nom attribué à une clé Match.

## Règle de correspondance (MatchRule)
<a name="match-rule-defn"></a>

Pour le rapprochement basé sur des règles, il s'agit du numéro de règle appliqué qui a généré un ensemble d'enregistrements correspondants. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Correspondance
<a name="matching-definition"></a>

Processus consistant à combiner et à comparer des données provenant de différents champs d'entrée, tables ou bases de données et à déterminer lesquelles de ces données sont similaires (ou « correspondent ») en fonction de certains critères de correspondance (par exemple, par le biais de règles ou de modèles de correspondance).

## Flux de travail correspondant
<a name="matching-workflow-definition"></a>

Le processus que vous avez configuré pour spécifier les données d'entrée à associer et la manière dont la correspondance doit être effectuée.

## Description du flux de travail correspondant
<a name="matching-workflow-description"></a>

Description facultative du flux de travail correspondant que vous pouvez choisir de saisir. Les descriptions vous aident à différencier les flux de travail correspondants si vous en créez plusieurs.

## Nom du flux de travail correspondant
<a name="matching-workflow-name"></a>

Nom du flux de travail correspondant que vous spécifiez. 

**Note**  
Les noms de flux de travail correspondants doivent être uniques. Ils ne peuvent pas porter le même nom, sinon une erreur sera renvoyée.

## Metadonnées de flux de travail correspondantes
<a name="matching-workflow-metadata"></a>

Informations générées et sorties par Résolution des entités AWS lors d'une tâche de flux de travail correspondante. Ces informations sont requises lors de la sortie.

## Normalisation (ApplyNormalization)
<a name="normalization-defn"></a>

Choisissez si vous souhaitez normaliser les données d'entrée telles que définies dans le schéma. La normalisation normalise les données en supprimant les espaces et les caractères spéciaux supplémentaires et en normalisant le format en minuscules. 

Par exemple, si le type d'attribut d'un champ de saisie est [Full phone](#normalization-rule-phone) et que les valeurs de la table de saisie sont mises en forme`(123) 456-7890`, les valeurs Résolution des entités AWS seront normalisées en`1234567890`.

**Note**  
La normalisation n'est prise en charge que pour le type de groupe pour [le nom](#normalization-rule-name), [l'adresse](#normalization-rule-address), le [téléphone](#normalization-rule-phone) et le [courrier électronique](#normalization-rule-email). 

Les sections suivantes décrivent nos règles de normalisation standard. 

Pour la correspondance basée sur le ML en particulier, voir. [Normalisation (ApplyNormalization) — Basé uniquement sur le ML](#normalization-ML-defn)

**Topics**
+ [Nom](#normalization-rule-name)
+ [E-mail](#normalization-rule-email)
+ [Téléphone](#normalization-rule-phone)
+ [Adresse](#normalization-rule-address)
+ [Haché](#normalization-rule-hashed)
+ [Identifiant de la source](#normalization-rule-source-id)

### Nom
<a name="normalization-rule-name"></a>

**Note**  
La normalisation n'est prise en charge que pour le type de groupe de **noms**.   
Le type de groupe **Nom** apparaît sous forme de **nom complet** dans la console et `NAME` dans l'API.  
Si vous souhaitez normaliser les sous-types du type de groupe **Name** :   
Dans la console, attribuez les sous-types suivants au groupe de **noms complets** : **prénom, deuxième **prénom**** **et nom** de famille.
Dans l'[CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, attribuez les **types** suivants au `NAME` **GroupName** : `NAME_FIRST``NAME_MIDDLE`, et. `NAME_LAST`
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules
+ **CONVERT\$1ACCENT** = Convertit une lettre accentuée en lettre normale
+ **REMOVE\$1ALL\$1NON\$1ALPHA = Supprime tous les caractères non alphabétiques [A-za-Z**]

### E-mail
<a name="normalization-rule-email"></a>

**Note**  
La normalisation est prise en charge pour le type de groupe de **courrier électronique**.   
Le type de groupe d'**e-mails** apparaît sous forme d'**adresse e-mail** dans la console et `EMAIL_ADDRESS` dans l'API.
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules
+ **CONVERT\$1ACCENT** = Convertit une lettre accentuée en lettre normale
+ **EMAIL\$1ADDRESS\$1UTIL\$1NORM** = Supprime tous les points (.) du nom d'utilisateur, supprime tout ce qui se trouve après un signe plus (\$1) dans le nom d'utilisateur et normalise les variations de domaine courantes
+ **REMOVE\$1ALL\$1NON\$1EMAIL\$1CHARS = Supprime tous non-alpha-numeric les caractères** [A-za-Z0-9] et [.@-]

### Téléphone
<a name="normalization-rule-phone"></a>

**Note**  
La normalisation n'est prise en charge que pour le type de groupe **téléphonique**.  
Le type de groupe **téléphonique** apparaît sous la forme **Téléphone complet** dans la console et `PHONE` dans l'API.  
Si vous souhaitez normaliser les sous-types du type de groupe **téléphonique** :   
Dans la console, attribuez les sous-types suivants au groupe **téléphonique complet** : **numéro de téléphone** et **code de pays du téléphone**.
Dans l'[CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, attribuez les **types** suivants au `PHONE` **GroupName** : `PHONE_NUMBER` et. `PHONE_COUNTRYCODE`
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **REMOVE\$1ALL\$1NON\$1NUMERIC = Supprime tous les caractères non numériques [0-9]**
+ **REMOVE\$1ALL\$1LEADING\$1ZEROES = Supprime tous les zéros** en tête
+ **ENSURE\$1PREFIX\$1WITH\$1MAP, "phonePrefixMap"** = Examine chaque numéro de téléphone et essaie de le comparer aux modèles du. phonePrefixMap Si une correspondance est trouvée, la règle ajoutera ou modifiera le préfixe du numéro de téléphone pour s'assurer qu'il est conforme au format standardisé spécifié sur la carte.

### Adresse
<a name="normalization-rule-address"></a>

**Note**  
La normalisation n'est prise en charge que pour le type de groupe d'**adresses**.   
Le type de groupe d'**adresses** apparaît sous la forme **Adresse complète** dans la console et `ADDRESS ` dans l'API.  
Si vous souhaitez normaliser les sous-types du type de groupe d'**adresses** :   
Dans la console, attribuez les sous-types suivants au groupe d'**adresses complètes** : **Adresse postale 1**, **Adresse postale 2** : nom de l'**adresse 3, nom** de **la ville**, **État**, **pays** et **code postal t**
Dans l'[CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, attribuez les **types** suivants au `ADDRESS` **GroupName** :`ADDRESS_STREET1`,`ADDRESS_STREET2`,`ADDRESS_STREET3`, `ADDRESS_CITY` `ADDRESS_STATE``ADDRESS_COUNTRY`, et. `ADDRESS_POSTALCODE`
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules
+ **CONVERT\$1ACCENT** = Convertit une lettre accentuée en lettre normale
+ **REMOVE\$1ALL\$1NON\$1ALPHA = Supprime tous les caractères non alphabétiques [A-za-Z**]
+ **[RENAME\$1WORDS en utilisant ADDRESS\$1RENAME\$1WORD\$1MAP = remplacez les mots de la chaîne d'adresse par des mots de ADDRESS\$1RENAME\$1WORD\$1MAP](#ADDRESS_RENAME_WORD_MAP)**
+ **[RENAME\$1DELIMITERS en utilisant ADDRESS\$1RENAME\$1DELIMITER\$1MAP = remplacez les délimiteurs dans la chaîne d'adresse par la chaîne ADDRESS\$1RENAME\$1DELIMITER\$1MAP](#ADDRESS_RENAME_DELIMITER_MAP)**
+ **[RENAME\$1DIRECTIONS en utilisant ADDRESS\$1RENAME\$1DIRECTION\$1MAP = remplacez les délimiteurs dans la chaîne d'adresse par la chaîne ADDRESS\$1RENAME\$1DIRECTION\$1MAP](#ADDRESS_RENAME_DIRECTION_MAP)**
+ **[RENAME\$1NUMBERS en utilisant ADDRESS\$1RENAME\$1NUMBER\$1MAP = remplacez les numéros de la chaîne d'adresse par la chaîne ADDRESS\$1RENAME\$1NUMBER\$1MAP](#ADDRESS_RENAME_NUMBER_MAP.title)**
+ **[RENAME\$1SPECIAL\$1CHARS en utilisant ADDRESS\$1RENAME\$1SPECIAL\$1CHAR\$1MAP = remplacez les caractères spéciaux de la chaîne d'adresse par la chaîne ADDRESS\$1RENAME\$1SPECIAL\$1CHAR\$1MAP](#ADDRESS_RENAME_SPECIAL_CHAR_MAP.title)**

#### ADRESSE\$1RENOMME\$1WORD\$1MAP
<a name="ADDRESS_RENAME_WORD_MAP"></a>

Ce sont les mots qui seront renommés lors de la normalisation de la chaîne d'adresse.

```
"avenue": "ave",
 "bouled": "blvd",
 "circle": "cir",
 "circles": "cirs",
 "court": "ct",
 "centre": "ctr",
 "center": "ctr",
 "drive": "dr",
 "freeway": "fwy",
 "frwy": "fwy",
 "highway": "hwy",
 "lane": "ln",
 "parks": "park",
 "parkways": "pkwy",
 "pky": "pkwy",
 "pkway": "pkwy",
 "pkwys": "pkwy",
 "parkway": "pkwy",
 "parkwy": "pkwy",
 "place": "pl",
 "plaza": "plz",
 "plza": "plz",
 "road": "rd",
 "square": "sq",
 "squ": "sq",
 "sqr": "sq",
 "street": "st",
 "str": "st",
 "str.": "strasse"
```

#### ADRESSE\$1RENAME\$1DELIMITER\$1MAP
<a name="ADDRESS_RENAME_DELIMITER_MAP"></a>

Ce sont les délimiteurs qui seront renommés lors de la normalisation de la chaîne d'adresse.

```
",": " ",
".": " ",
"[": " ",
"]": " ",
"/": " ",
"-": " ",
"#": " number "
```

#### ADRESSE\$1RENAME\$1DIRECTION\$1MAP
<a name="ADDRESS_RENAME_DIRECTION_MAP"></a>

Il s'agit des identificateurs de direction qui seront renommés lors de la normalisation de la chaîne d'adresse.

```
"east": "e",
"north": "n",
"south": "s",
"west": "w",
"northeast": "ne",
"northwest": "nw",
"southeast": "se",
"southwest": "sw"
```

#### ADRESSE\$1RENOMME\$1NUMÉRO\$1MAP
<a name="ADDRESS_RENAME_NUMBER_MAP"></a>

Il s'agit des chaînes numériques qui seront renommées lors de la normalisation de la chaîne d'adresse.

```
"número": "number",
 "numero": "number",
 "no": "number",
 "núm": "number",
 "num": "number"
```

#### ADRESSE\$1RENAME\$1SPECIAL\$1CHAR\$1MAP
<a name="ADDRESS_RENAME_SPECIAL_CHAR_MAP"></a>

Il s'agit de la chaîne de caractères spéciaux qui sera renommée lors de la normalisation de la chaîne d'adresse.

```
"ß": "ss",
 "ä": "ae",
 "ö": "oe",
 "ü": "ue",
 "ø": "o",
 "æ": "ae"
```

### Haché
<a name="normalization-rule-hashed"></a>
+ **TRIM** = Supprime les espaces blancs avant et arrière

### Identifiant de la source
<a name="normalization-rule-source-id"></a>
+ **TRIM** = Supprime les espaces blancs avant et arrière

## Normalisation (ApplyNormalization) — Basé uniquement sur le ML
<a name="normalization-ML-defn"></a>

Choisissez si vous souhaitez normaliser les données d'entrée telles que définies dans le schéma. La normalisation normalise les données en supprimant les espaces et les caractères spéciaux supplémentaires et en normalisant le format en minuscules. 

Par exemple, si un champ de saisie possède un type d'`NAME`attribut et que les valeurs de la table d'entrée sont mises en forme`Johns Smith`, les valeurs Résolution des entités AWS seront normalisées en`john smith`.

Les sections suivantes décrivent les règles de normalisation pour les flux de travail de [correspondance basés sur le machine learning](#ml-matching-defn).

**Topics**
+ [Nom](#normalization-ML-defn-name)
+ [E-mail](#normalization-ML-defn-email)
+ [Téléphone](#normalization-ML-defn-phone)

### Nom
<a name="normalization-ML-defn-name"></a>
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules

### E-mail
<a name="normalization-ML-defn-email"></a>
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules
+ Remplace uniquement (at) (sensible aux majuscules et minuscules) par le symbole @
+ Supprime tous les espaces blancs, n'importe où dans la valeur 
+ Supprime tout ce qui se trouve en dehors du premier `"<` `>"` s'il existe

### Téléphone
<a name="normalization-ML-defn-phone"></a>
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **REMOVE\$1ALL\$1NON\$1NUMERIC = Supprime tous les caractères non numériques [0-9]**
+ **REMOVE\$1ALL\$1LEADING\$1ZEROES = Supprime tous les zéros** en tête
+ **ENSURE\$1PREFIX\$1WITH\$1MAP, "phonePrefixMap"** = Examine chaque numéro de téléphone et essaie de le comparer aux modèles du. phonePrefixMap Si une correspondance est trouvée, la règle ajoutera ou modifiera le préfixe du numéro de téléphone pour s'assurer qu'il est conforme au format standardisé spécifié sur la carte.

## One-to-One appariement
<a name="one-to-one-matching-defn"></a>

One-to-one le matching compare des instances uniques de données similaires. Les champs de saisie ayant la même clé de correspondance et les mêmes valeurs dans le même champ de saisie seront comparés les uns aux autres. 

Par exemple, vous pouvez avoir plusieurs champs de saisie de numéros de téléphone, tels `home_phone` que `mobile_phone` et qui ont la même touche de correspondance « Téléphone ». Utilisez le one-to-one rapprochement pour comparer les données du champ de `mobile_phone` saisie avec les données du champ de `mobile_phone` saisie et pour comparer les données du champ de `home_phone` saisie avec les données du champ de `home_phone` saisie. Les données du champ de `mobile_phone` saisie ne seront pas comparées aux données du champ de `home_phone` saisie. 

Les règles de correspondance évaluent les données de plusieurs champs de saisie avec la même clé de correspondance à l'aide d'une opération (ou), et le one-to-many rapprochement compare les valeurs d'un seul champ de saisie. Cela signifie que si `mobile_phone` ou `home_phone` correspond entre deux enregistrements, la touche de correspondance « Téléphone » renverra une correspondance. Pour la touche de correspondance « Téléphone » pour trouver une correspondance, `Record One mobile_phone = Record Two mobile_phone` OU`Record One home_phone = Record Two home_phone`. 

Les règles de correspondance évaluent les données dans les champs de saisie dotés de différentes clés de correspondance à l'aide d'une opération (et). Si vous souhaitez que la correspondance basée sur des règles prenne en compte les différents types d'informations de numéro de téléphone de manière complètement séparée, vous pouvez créer des clés de correspondance plus spécifiques, telles que « mobile\$1phone » et « home\$1phone ». Si vous souhaitez utiliser les deux touches de correspondance dans une règle pour rechercher des correspondances, `Record One mobile_phone = Record Two mobile_phone` ET`Record One home_phone = Record Two home_phone`.

## Output
<a name="output-defn"></a>

Une liste d'**OutputAttribute**objets, dont chacun comporte les champs **Name** et **Hashed**. Chacun de ces objets représente une colonne à inclure dans la table AWS Glue de sortie et indique si vous souhaitez que les valeurs de la colonne soient hachées.

## Sorties 3 voies
<a name="output-s3-path"></a>

Destination S3 vers laquelle Résolution des entités AWS sera écrite la table de sortie.

## OutputSourceConfig
<a name="output-source-config"></a>

**Une liste d' OutputSource objets, dont chacun possède les champs **Outputs3Path** et Output. **ApplyNormalization****

## Correspondance basée sur les services des fournisseurs
<a name="provider-service-matching"></a>

Le jumelage basé sur les services des fournisseurs est un processus conçu pour associer, relier et améliorer vos dossiers avec les fournisseurs de services de données préférés et les ensembles de données sous licence. Vous devez avoir souscrit un abonnement AWS Data Exchange auprès du service du fournisseur pour utiliser cette technique de mise en correspondance.

Résolution des entités AWS s'intègre actuellement aux fournisseurs de services de données suivants : 
+ LiveRamp
+ TransUnion
+ UID 2.0

## Correspondance basée sur des règles
<a name="rule-based-matching-defn"></a>

La correspondance basée sur des règles est un processus conçu pour trouver des correspondances exactes. La correspondance basée sur des règles est un ensemble hiérarchique de règles de correspondance en cascade, suggérées par Résolution des entités AWS, sur la base des données que vous saisissez et entièrement configurables par vos soins. Toutes les clés de correspondance fournies dans le cadre des critères des règles doivent correspondre exactement pour que les données comparées soient déclarées concordantes et pour que les métadonnées associées soient sorties. La correspondance basée sur des règles renvoie un [identifiant de correspondance](#match-id-defin) et un numéro de règle pour chaque ensemble de données correspondant.

Nous recommandons de définir des règles permettant d'identifier une entité de manière unique. Classez vos règles pour trouver d'abord des correspondances plus précises. 

Supposons, par exemple, que vous ayez deux règles, la **règle 1** et la **règle 2**.

Ces règles comportent les clés de correspondance suivantes :
+ **La règle 1** inclut le nom complet et l'adresse
+ **La règle 2** inclut le nom complet, l'adresse et le téléphone

Comme la **Règle 1** s'exécute en premier, aucune correspondance ne sera trouvée par la **Règle 2** car elles auraient toutes été trouvées selon la **Règle 1**.

Pour trouver des correspondances différenciées par téléphone, réorganisez les règles comme suit :
+ **La règle 2** inclut le nom complet, l'adresse et le téléphone
+ **La règle 1** inclut le nom complet et l'adresse

## Schema
<a name="schema-definition"></a>

Terme utilisé pour désigner une structure ou une mise en page définissant la manière dont un ensemble de données est organisé et connecté.

## Description du schéma
<a name="schema-description-defn"></a>

Description facultative du schéma que vous pouvez choisir de saisir. Les descriptions vous aident à différencier les mappages de schéma si vous en créez plusieurs.

## Nom du schéma
<a name="schema-name-defn"></a>

Nom du schéma. 

**Note**  
Les noms de schéma doivent être uniques. Ils ne peuvent pas porter le même nom, sinon une erreur sera renvoyée.

## Cartographie du schéma
<a name="schema-mapping-definition"></a>

Le mappage du schéma Résolution des entités AWS est le processus par lequel vous indiquez Résolution des entités AWS comment interpréter vos données à des fins de correspondance. Vous définissez le schéma de la table de données d'entrée que vous Résolution des entités AWS souhaitez lire dans un flux de travail correspondant.

## ARN de mappage de schéma
<a name="schema-arn-defn"></a>

Amazon Resource Name (ARN) généré pour le [mappage du schéma](#schema-mapping-definition).

## Identifiant unique
<a name="unique-id-defn"></a>

Identifiant unique que vous désignez et qui doit être attribué à chaque ligne de données d'entrée Résolution des entités AWS lue.

**Example**  
Par exemple : **Primary\$1key**, **Row\$1ID** ou **Record\$1ID**.

La colonne **Unique ID** est obligatoire.

 L'**identifiant unique** doit être un identifiant unique au sein d'une même table. 

L'**identifiant unique** doit respecter le modèle suivant : `[a-zA-Z0-9_-]`

Dans différentes tables, l'**identifiant unique peut comporter** des valeurs dupliquées. 

La longueur maximale de l'**identifiant unique** est de 38 pour un [flux de travail correspondant](#matching-workflow-definition)

La longueur maximale de l'**identifiant unique** est de 257 caractères pour un [Workflow de mappage des identifiants](#id-mapping-workflow-defn)

Lorsque le [flux de travail correspondant](#matching-workflow-definition) est exécuté, l'enregistrement est rejeté si l'**ID unique** :
+ n'est pas spécifié
+ n'est pas unique au sein d'une même table
+ chevauchements en termes de nom d'attribut entre les sources
+ dépasse 38 caractères (flux de travail de correspondance basés sur des règles uniquement)