

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# AWS Entity Resolution Glossar
<a name="glossary"></a>

## Amazon-Ressourcenname (ARN)
<a name="arn-definition"></a>

Eine eindeutige Kennung für AWS Ressourcen. ARNs sind erforderlich, wenn Sie eine Ressource in allen Bereichen eindeutig angeben müssen AWS Entity Resolution, z. B. in AWS Entity Resolution Richtlinien, Amazon Relational Database Service (Amazon RDS) -Tags und API-Aufrufen.

## Attribut Typ
<a name="attribute-type-defn"></a>

Der Typ des Attributs für das Eingabefeld. Wenn Sie [eine Schemazuordnung erstellen](create-schema-mapping.md), wählen Sie den **Attributtyp** aus einer vorkonfigurierten Werteliste wie **Name**, **Adresse**, **Telefonnummer** oder **E-Mail-Adresse** aus. Der Attributtyp gibt an, AWS Entity Resolution welche Art von Daten Sie präsentieren, sodass sie ordnungsgemäß klassifiziert und normalisiert werden können.

## Automatische Verarbeitung
<a name="incremental-processing"></a>

Eine Option für den Verarbeitungsrhythmus für einen passenden Workflow-Job, mit der dieser automatisch ausgeführt werden kann, wenn sich Ihre Dateneingabe ändert. 

Diese Option ist nur für den [regelbasierten](#rule-based-matching-defn) Abgleich verfügbar.

Standardmäßig ist der Verarbeitungsrhythmus für einen passenden Workflow-Auftrag auf [**Manuell**](#manual-processing) festgelegt, sodass er bei Bedarf ausgeführt werden kann. Sie können die **automatische** Verarbeitung so einrichten, dass Ihr passender Workflow-Job automatisch ausgeführt wird, wenn sich Ihre Dateneingabe ändert. Dadurch bleibt Ihre passende Workflow-Ausgabe erhalten up-to-date.

## AWS KMS key ARN
<a name="kms-arn-defn"></a>

Dies ist Ihr AWS KMS Amazon-Ressourcenname (ARN) für die Verschlüsselung im Ruhezustand. Falls nicht angegeben, verwendet das System einen AWS Entity Resolution verwalteten KMS-Schlüssel.

## Batch-Arbeitsablauf
<a name="batch-defn"></a>

Ein Prozess, der in geplanten Intervallen ausgeführt wird, um Daten aus einem gesamten Datensatz abzugleichen und aufzulösen. Batch-Workflows in AWS Entity Resolution eignen sich am besten für die Ersteinrichtung, regelmäßige vollständige Aktualisierungen und Szenarien mit erheblichen Änderungen sowohl in Quell- als auch in Zieldatensätzen.

## Klarer Text
<a name="cleartext-defn"></a>

Daten, die nicht kryptografisch geschützt sind.

## Konfidenzniveau () ConfidenceLevel
<a name="confidence-level-defn"></a>

Beim ML-Abgleich ist dies das Konfidenzniveau, das angewendet wird AWS Entity Resolution , wenn ML einen übereinstimmenden Datensatz identifiziert. Dies ist Teil der [passenden Workflow-Metadaten](#matching-workflow-metadata), die in die Ausgabe aufgenommen werden.

## Entschlüsselung
<a name="decryption-defn"></a>

Der Prozess der Rücktransformation verschlüsselter Daten in ihre ursprüngliche Form. Die Entschlüsselung kann nur durchgeführt werden, wenn Sie Zugriff auf den geheimen Schlüssel haben.

## Verschlüsselung
<a name="encryption-defn"></a>

Der Vorgang, bei dem Daten mithilfe eines geheimen Werts, eines sogenannten Schlüssels, in eine Form kodiert werden, die zufällig erscheint. Ohne Zugriff auf den Schlüssel ist es unmöglich, den ursprünglichen Klartext zu ermitteln.

## Gruppenname
<a name="group-name-defn"></a>

Der **Gruppenname** verweist auf die gesamte Gruppe von Eingabefeldern und kann Ihnen helfen, analysierte Daten zu Vergleichszwecken zu gruppieren.

Wenn es beispielsweise drei Eingabefelder gibt:**first\$1name**, und**middle\$1name**, können Sie sie gruppieren**last\$1name**, indem Sie den **Gruppennamen** eingeben, wie **full\$1name** für den Abgleich und die Ausgabe.

## Hash
<a name="hash-defn"></a>

Hashing bedeutet, einen kryptografischen Algorithmus anzuwenden, der eine unumkehrbare und eindeutige Zeichenfolge mit fester Größe erzeugt, die als Hash bezeichnet wird. AWS Entity Resolution verwendet das 256-Bit-Hash-Protokoll (SHA256) des Secure Hash Algorithm und gibt eine 32-Byte-Zeichenfolge aus. In können Sie wählen AWS Entity Resolution, ob Sie Datenwerte in Ihrer Ausgabe hashen möchten.

## Hash-Protokoll (HashingProtocol)
<a name="hash-protocol-defn"></a>

AWS Entity Resolution verwendet das 256-Bit-Hash-Protokoll (SHA256) des Secure Hash Algorithm und gibt eine 32-Byte-Zeichenfolge aus. Dies ist Teil der [passenden Workflow-Metadaten](#matching-workflow-metadata), die in die Ausgabe aufgenommen werden.

## Methode der ID-Zuordnung
<a name="id-mapping-method-defn"></a>

Wie die ID-Zuordnung durchgeführt werden soll. 

Es gibt zwei Methoden zur ID-Zuordnung: 
+ Regelbasiert — Die Methode, mit der Sie Abgleichsregeln verwenden, um First-Party-Daten in einem ID-Mapping-Workflow von einer Quelle in ein Ziel zu übersetzen.
+ Anbieterdienste — Die Methode, mit der Sie einen Provider-Service verwenden, um in einem ID-Mapping-Workflow von Drittanbietern codierte Daten von einer Quelle in ein Ziel zu übersetzen.

  AWS Entity Resolution unterstützt derzeit die LiveRamp auf Providerdiensten basierende ID-Mapping-Methode. Sie müssen über ein Abonnement für LiveRamp Through verfügen, um diese AWS Data Exchange Methode verwenden zu können. Weitere Informationen finden Sie unter [Schritt 1: Abonnieren Sie einen Anbieterdienst unter AWS Data Exchange](prepare-third-party-input-data.md#subscribe-provider-service).

## Arbeitsablauf bei der ID-Zuordnung
<a name="id-mapping-workflow-defn"></a>

Ein Datenverarbeitungsjob, der Daten aus einer Eingabedatenquelle einem Eingabedatenziel auf der Grundlage der angegebenen ID-Zuordnungsmethode zuordnet. Es erzeugt eine ID-Zuordnungstabelle. Für diesen Workflow müssen Sie die [ID-Zuordnungsmethode](#id-mapping-method-defn) und die Eingabedaten angeben, die Sie von einer Quelle in ein Ziel übersetzen möchten. 

Sie können einen ID-Mapping-Workflow so einrichten, dass er entweder in Ihrem eigenen AWS-Konto oder in zwei Schritten ausgeführt wird AWS-Konten.

## ID-Namespace
<a name="id-namespace-defn"></a>

Eine Ressource AWS Entity Resolution , die Metadaten enthält, die mehrere Datensätze AWS-Konten und die Verwendung dieser Datensätze in einem [ID-Mapping-Workflow](#id-mapping-workflow-defn) erläutern.

Es gibt zwei Arten von ID-Namespaces: und. `SOURCE` `TARGET` Das `SOURCE` enthält Konfigurationen für die Quelldaten, die in einem ID-Mapping-Workflow verarbeitet werden. Das `TARGET` enthält eine Konfiguration der Zieldaten, in die alle Quellen aufgelöst werden. Um die Eingabedaten zu definieren, die Sie über zwei auflösen möchten AWS-Konten, erstellen Sie eine ID-Namespace-Quelle und ein ID-Namespace-Ziel, um Ihre Daten von einem Satz (`SOURCE`) in einen anderen () zu übersetzen. `TARGET`

Nachdem Sie und ein anderes Mitglied ID-Namespaces erstellt und einen ID-Zuordnungs-Workflow ausgeführt haben, können Sie einer Kollaboration beitreten, AWS Clean Rooms um eine Verknüpfung mehrerer Tabellen für die ID-Zuordnungstabelle auszuführen und die Daten zu analysieren.

Weitere Informationen finden Sie im [AWS Clean Rooms -Benutzerhandbuch](https://docs.aws.amazon.com/clean-rooms/latest/userguide/what-is.html).

## Inkrementeller Arbeitsablauf
<a name="incremental-defn"></a>

Ein Prozess, der nur neue oder aktualisierte Datensätze seit dem letzten Lauf abgleicht und auflöst, anstatt den gesamten Datensatz zu verarbeiten. Inkrementelle Workflows AWS Entity Resolution eignen sich am besten für häufige Aktualisierungen, um die Aktualität der Daten aufrechtzuerhalten, wenn sich nur ein kleiner Teil des Datensatzes geändert hat.

## Eingabefeld
<a name="input-field-defn"></a>

Ein Eingabefeld entspricht einem Spaltennamen aus Ihrer AWS Glue Eingabedatentabelle.

## Eingangsquelle ARN (InputSourceARN)
<a name="input-source-arn-defn"></a>

Der Amazon-Ressourcenname (ARN), der für eine AWS Glue Tabelleneingabe generiert wurde. Dies ist Teil der [passenden Workflow-Metadaten](#matching-workflow-metadata), die in die Ausgabe aufgenommen werden.

## Auf maschinellem Lernen basierendes Matching
<a name="ml-matching-defn"></a>

Der auf maschinellem Lernen basierende Abgleich (ML-Matching) findet Übereinstimmungen in Ihren Daten, die möglicherweise unvollständig sind oder nicht exakt gleich aussehen. Der ML-Abgleich ist ein voreingestellter Prozess, bei dem versucht wird, Datensätze aus allen von Ihnen eingegebenen Daten abzugleichen. Der ML-Abgleich gibt eine [Match-ID](#match-id-defin) und ein [Konfidenzniveau](#confidence-level-defn) für jeden übereinstimmenden Datensatz zurück.

## Manuelle Verarbeitung
<a name="manual-processing"></a>

Eine Option für die Schrittfrequenz eines passenden Workflow-Auftrags, mit der dieser bei Bedarf ausgeführt werden kann. 

Diese Option ist standardmäßig festgelegt und sowohl für den [regelbasierten Abgleich als auch für den auf [maschinellem Lernen](#ml-matching-defn) basierenden Abgleich](#rule-based-matching-defn) verfügbar.

## Many-to-Many übereinstimmend
<a name="many-to-many-defin"></a>

Many-to-many Beim Abgleich werden mehrere Instanzen ähnlicher Daten verglichen. Werte in Eingabefeldern, denen derselbe Zuordnungsschlüssel zugewiesen wurde, werden miteinander abgeglichen, unabhängig davon, ob sie sich im selben Eingabefeld oder in verschiedenen Eingabefeldern befinden. 

Beispielsweise haben Sie möglicherweise mehrere Eingabefelder für Telefonnummern wie `mobile_phone` und `home_phone` die gleiche Abgleichstaste „Telefon“. Verwenden many-to-many Sie den Abgleich, um Daten im `mobile_phone` Eingabefeld mit Daten im `mobile_phone` Eingabefeld und Daten im `home_phone` Eingabefeld zu vergleichen. 

Mit Abgleichsregeln werden Daten in mehreren Eingabefeldern mit demselben Abgleichsschlüssel mit einer (oder) -Operation ausgewertet, und beim one-to-many Abgleich werden Werte aus mehreren Eingabefeldern verglichen. Das bedeutet, dass, wenn eine Kombination von `mobile_phone` oder zwischen zwei Datensätzen `home_phone` übereinstimmt, die Vergleichstaste „Telefon“ eine Übereinstimmung zurückgibt. Für die Suchtaste „Telefon“, um eine Übereinstimmung zu finden, `Record One mobile_phone = Record Two mobile_phone` ODER `Record One mobile_phone = Record Two home_phone` ODER `Record One home_phone = Record Two home_phone` ODER`Record One home_phone = Record Two mobile_phone`.

## Spiel-ID (MatchID)
<a name="match-id-defin"></a>

Bei regelbasiertem Abgleich und ML-Matching ist dies die ID, die von jeder übereinstimmenden Datensatzgruppe generiert AWS Entity Resolution und auf diese angewendet wird. Dies ist Teil der [passenden Workflow-Metadaten](#matching-workflow-metadata), die in die Ausgabe aufgenommen werden.

## Schlüssel abgleichen (MatchKey)
<a name="match-key-defn"></a>

Der Abgleichsschlüssel AWS Entity Resolution gibt an, welche Eingabefelder als ähnliche Daten und welche als unterschiedliche Daten betrachtet werden sollen. Auf diese Weise können regelbasierte Abgleichsregeln AWS Entity Resolution automatisch konfiguriert und ähnliche Daten, die in verschiedenen Eingabefeldern gespeichert sind, verglichen werden. 

Wenn Ihre Daten mehrere Arten von Telefonnummerninformationen wie ein `mobile_phone` Eingabefeld und ein `home_phone` Eingabefeld enthalten, die Sie miteinander vergleichen möchten, können Sie beiden die Abgleichstaste „Telefon“ geben. Anschließend kann der regelbasierte Abgleich so konfiguriert werden, dass Daten mithilfe von „oder“ -Anweisungen in allen Eingabefeldern mit dem Abgleichsschlüssel „Telefon“ verglichen werden (siehe [One-to-One Matching und [Many-to-Many Matching](#many-to-many-defin)](#one-to-one-matching-defn) Definitionen im Abschnitt Matching Workflow). 

Wenn Sie möchten, dass beim regelbasierten Abgleich verschiedene Arten von Telefonnummerninformationen vollständig getrennt berücksichtigt werden, können Sie spezifischere Abgleichsschlüssel wie „Mobile\$1Phone“ und „Home\$1Phone“ erstellen. Anschließend können Sie beim Einrichten eines Workflows für den Abgleich angeben, wie die einzelnen Telefonzuordnungsschlüssel beim regelbasierten Abgleich verwendet werden sollen. 

Wenn für ein bestimmtes Eingabefeld kein Wert angegeben MatchKey ist, kann es nicht für den Abgleich verwendet werden, sondern es kann den Abgleichs-Workflow-Prozess durchlaufen und bei Bedarf ausgegeben werden.

## Schlüsselname abgleichen
<a name="match-key-name-defn"></a>

Der Name, der einem Match-Schlüssel zugewiesen wurde.

## Zuordnungsregel (MatchRule)
<a name="match-rule-defn"></a>

Bei regelbasiertem Abgleich ist dies die angewendete Regelnummer, mit der ein übereinstimmender Datensatz generiert wurde. Dies ist Teil der [passenden Workflow-Metadaten](#matching-workflow-metadata), die in die Ausgabe aufgenommen werden.

## Übereinstimmung
<a name="matching-definition"></a>

Der Prozess, bei dem Daten aus verschiedenen Eingabefeldern, Tabellen oder Datenbanken kombiniert und verglichen werden und anhand der Erfüllung bestimmter Abgleichskriterien (z. B. entweder durch Abgleichsregeln oder Modelle) ermittelt wird, welche davon ähnlich sind — oder „übereinstimmen“.

## Arbeitsablauf beim Abgleich
<a name="matching-workflow-definition"></a>

Der Prozess, den Sie eingerichtet haben, um anzugeben, welche Eingabedaten miteinander abgeglichen werden sollen und wie der Abgleich durchgeführt werden soll.

## Beschreibung des passenden Workflows
<a name="matching-workflow-description"></a>

Eine optionale Beschreibung des passenden Workflows, die Sie möglicherweise eingeben möchten. Beschreibungen helfen Ihnen dabei, zwischen passenden Workflows zu unterscheiden, wenn Sie mehr als einen erstellen.

## Passender Workflow-Name
<a name="matching-workflow-name"></a>

Der Name für den passenden Workflow, den Sie angeben. 

**Anmerkung**  
Übereinstimmende Workflow-Namen müssen eindeutig sein. Sie dürfen nicht denselben Namen haben, da sonst ein Fehler zurückgegeben wird.

## Passende Workflow-Metadaten
<a name="matching-workflow-metadata"></a>

Informationen, die AWS Entity Resolution während eines passenden Workflow-Jobs generiert und ausgegeben wurden. Diese Informationen sind bei der Ausgabe erforderlich.

## Normalisierung () ApplyNormalization
<a name="normalization-defn"></a>

Wählen Sie aus, ob die Eingabedaten wie im Schema definiert normalisiert werden sollen. Bei der Normalisierung werden Daten standardisiert, indem zusätzliche Leerzeichen und Sonderzeichen entfernt und das Format auf Kleinbuchstaben standardisiert wird. 

Wenn ein Eingabefeld beispielsweise den Attributtyp [Vollständige Telefonnummer](#normalization-rule-phone) hat und die Werte in der Eingabetabelle als formatiert sind`(123) 456-7890`, AWS Entity Resolution werden die Werte auf normalisiert. `1234567890`

**Anmerkung**  
[Die Normalisierung wird nur für den Gruppentyp für [Name](#normalization-rule-name), [Adresse](#normalization-rule-address), [Telefon](#normalization-rule-phone) und E-Mail unterstützt.](#normalization-rule-email) 

In den folgenden Abschnitten werden unsere Standardnormalisierungsregeln beschrieben. 

Informationen speziell zum ML-basierten Abgleich finden Sie unter. [Normalisierung () ApplyNormalization — Nur ML-basiert](#normalization-ML-defn)

**Topics**
+ [Name](#normalization-rule-name)
+ [Email](#normalization-rule-email)
+ [Phone](#normalization-rule-phone)
+ [Adresse](#normalization-rule-address)
+ [Gehasht](#normalization-rule-hashed)
+ [Quell-ID](#normalization-rule-source-id)

### Name
<a name="normalization-rule-name"></a>

**Anmerkung**  
Die Normalisierung wird nur für den Gruppentyp **Name** unterstützt.   
Der Gruppentyp **Name** wird in der Konsole und wie in der API als **`NAME`Vollständiger Name** angezeigt.  
Wenn Sie die Untertypen des Gruppentyps **Name** normalisieren möchten:   
Weisen Sie in der Konsole der Gruppe **Vollständiger Name** die folgenden Untertypen zu: **Vorname**, **Zweiter Vorname** und **Nachname**.
Weisen Sie dem `NAME` **groupName** in der [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API die folgenden **Typen** zu: `NAME_FIRST``NAME_MIDDLE`, und`NAME_LAST`.
+ **TRIM = Kürzt** führende und nachfolgende Leerzeichen
+ **LOWERCASE** = Alle Alphazeichen werden in Kleinbuchstaben geschrieben
+ **CONVERT\$1ACCENT = Buchstaben mit verdecktem Akzent** in einen normalen Buchstaben umwandeln
+ **REMOVE\$1ALL\$1NON\$1ALPHA = Entfernt alle Nicht-Alpha-Zeichen [a-zA-Z**]

### Email
<a name="normalization-rule-email"></a>

**Anmerkung**  
Die Normalisierung wird für den **E-Mail-Gruppentyp** unterstützt.   
Der **E-Mail-Gruppentyp** wird in der Konsole als **E-Mail-Adresse** und `EMAIL_ADDRESS` in der API angezeigt.
+ **TRIM** = Schneidet führende und nachfolgende Leerzeichen ab
+ **LOWERCASE** = Alle Alphazeichen werden in Kleinbuchstaben geschrieben
+ **CONVERT\$1ACCENT = Buchstaben mit verdecktem Akzent** in einen normalen Buchstaben umwandeln
+ **EMAIL\$1ADDRESS\$1UTIL\$1NORM** = Entfernt alle Punkte (.) aus dem Benutzernamen, entfernt alles, was nach einem Pluszeichen (\$1) im Benutzernamen folgt, und standardisiert gängige Domain-Varianten
+ **REMOVE\$1ALL\$1NON\$1EMAIL\$1CHARS = Entfernt alle Zeichen [a-zA-Z0-9**] und [.@-] non-alpha-numeric

### Phone
<a name="normalization-rule-phone"></a>

**Anmerkung**  
Die Normalisierung wird nur für den **Gruppentyp** Telefon unterstützt.  
Der Gruppentyp **Telefon** wird in der Konsole als **Vollständiges Telefon** und `PHONE` in der API angezeigt.  
Wenn Sie die Untertypen des Gruppentyps **Telefon** normalisieren möchten, gehen Sie wie folgt vor:   
Weisen Sie in der Konsole der Gruppe **Vollständige Telefonnummer** die folgenden Untertypen zu: **Telefonnummer** und **Landesvorwahl des Telefons**.
Weisen Sie dem `PHONE` **groupName** in der [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API die folgenden **Typen** zu: `PHONE_NUMBER` und`PHONE_COUNTRYCODE`.
+ **TRIM = Kürzt** führende und nachfolgende Leerzeichen
+ **REMOVE\$1ALL\$1NON\$1NUMERIC = Entfernt alle nicht-numerischen** Zeichen [0-9]
+ **REMOVE\$1ALL\$1LEADING\$1ZEROES** = Entfernt alle führenden Nullen
+ **ENSURE\$1PREFIX\$1WITH\$1MAP, "" = Untersucht jede Telefonnummer und versucht, sie mit** den Mustern in der abzugleichen. phonePrefixMap phonePrefixMap Wenn eine Übereinstimmung gefunden wird, fügt die Regel das Präfix der Telefonnummer hinzu oder ändert es, um sicherzustellen, dass es dem in der Map angegebenen Standardformat entspricht.

### Adresse
<a name="normalization-rule-address"></a>

**Anmerkung**  
Die Normalisierung wird nur für den Gruppentyp „**Adresse**“ unterstützt.   
Der Gruppentyp **Adresse** wird in der Konsole und wie `ADDRESS ` in der API als **Vollständige Adresse** angezeigt.  
Wenn Sie die Untertypen des Gruppentyps **Adresse** normalisieren möchten:   
Weisen Sie in der Konsole der Gruppe **Vollständige Adresse** die folgenden Untertypen zu: **Straße 1**, **Straße 2**: Name der **Straße 3, Name** der **Stadt**, **Bundesland****, Land** und **Postleitzahl t**
Weisen Sie dem `ADDRESS` **groupName** in der [CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API die folgenden **Typen** zu:`ADDRESS_STREET1`,`ADDRESS_STREET2`,`ADDRESS_STREET3`,`ADDRESS_CITY`, `ADDRESS_STATE``ADDRESS_COUNTRY`, und`ADDRESS_POSTALCODE`.
+ **TRIM = Kürzt** führende und nachfolgende Leerzeichen
+ **LOWERCASE** = Alle Alphazeichen werden in Kleinbuchstaben geschrieben
+ **CONVERT\$1ACCENT = Buchstaben mit verdecktem Akzent** in einen normalen Buchstaben umwandeln
+ **REMOVE\$1ALL\$1NON\$1ALPHA = Entfernt alle Nicht-Alpha-Zeichen [a-zA-Z**]
+ [RAME\$1WORDS mit **ADDRESS\$1RAME\$1WORD\$1MAP = Ersetze Wörter in der Adresszeichenfolge durch Wörter aus ADDRESS\$1RAME\$1WORD\$1MAP**](#ADDRESS_RENAME_WORD_MAP)
+ **RAME\$1DELIMITERS mit ADDRESS\$1RAME\$1DELIMITER\$1MAP** = ersetzt Trennzeichen in der Adresszeichenfolge durch eine Zeichenfolge aus [ADDRESS\$1RAME\$1DELIMITER\$1MAP](#ADDRESS_RENAME_DELIMITER_MAP)
+ **RAME\$1DIRECTIONS mit ADDRESS\$1RAME\$1DIRECTION\$1MAP** [= ersetzt Trennzeichen in der Adresszeichenfolge durch eine Zeichenfolge aus ADDRESS\$1RAME\$1DIRECTION\$1MAP](#ADDRESS_RENAME_DIRECTION_MAP)
+ **RAME\$1NUMBERS mit ADDRESS\$1RAME\$1NUMBER\$1MAP** = ersetzt Zahlen in der Adresszeichenfolge durch eine Zeichenfolge aus [ADDRESS\$1RAME\$1NUMBER\$1MAP](#ADDRESS_RENAME_NUMBER_MAP.title)
+ **RAME\$1SPECIAL\$1CHARS mit ADDRESS\$1RAME\$1SPECIAL\$1CHAR\$1MAP** [= ersetzt Sonderzeichen in der Adresszeichenfolge durch eine Zeichenfolge aus ADDRESS\$1RAME\$1SPECIAL\$1CHAR\$1MAP](#ADDRESS_RENAME_SPECIAL_CHAR_MAP.title)

#### ADDRESS\$1RENAME\$1WORD\$1MAP
<a name="ADDRESS_RENAME_WORD_MAP"></a>

Dies sind die Wörter, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

```
"avenue": "ave",
 "bouled": "blvd",
 "circle": "cir",
 "circles": "cirs",
 "court": "ct",
 "centre": "ctr",
 "center": "ctr",
 "drive": "dr",
 "freeway": "fwy",
 "frwy": "fwy",
 "highway": "hwy",
 "lane": "ln",
 "parks": "park",
 "parkways": "pkwy",
 "pky": "pkwy",
 "pkway": "pkwy",
 "pkwys": "pkwy",
 "parkway": "pkwy",
 "parkwy": "pkwy",
 "place": "pl",
 "plaza": "plz",
 "plza": "plz",
 "road": "rd",
 "square": "sq",
 "squ": "sq",
 "sqr": "sq",
 "street": "st",
 "str": "st",
 "str.": "strasse"
```

#### ADDRESS\$1RENAME\$1DELIMITER\$1MAP
<a name="ADDRESS_RENAME_DELIMITER_MAP"></a>

Dies sind die Trennzeichen, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

```
",": " ",
".": " ",
"[": " ",
"]": " ",
"/": " ",
"-": " ",
"#": " number "
```

#### ADDRESS\$1RENAME\$1DIRECTION\$1MAP
<a name="ADDRESS_RENAME_DIRECTION_MAP"></a>

Dies sind die Richtungskennungen, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

```
"east": "e",
"north": "n",
"south": "s",
"west": "w",
"northeast": "ne",
"northwest": "nw",
"southeast": "se",
"southwest": "sw"
```

#### ADDRESS\$1RENAME\$1NUMBER\$1MAP
<a name="ADDRESS_RENAME_NUMBER_MAP"></a>

Dies sind die Zahlenfolgen, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

```
"número": "number",
 "numero": "number",
 "no": "number",
 "núm": "number",
 "num": "number"
```

#### ADDRESS\$1RENAME\$1SPECIAL\$1CHAR\$1MAP
<a name="ADDRESS_RENAME_SPECIAL_CHAR_MAP"></a>

Dies sind die Sonderzeichenfolgen, die bei der Normalisierung der Adresszeichenfolge umbenannt werden.

```
"ß": "ss",
 "ä": "ae",
 "ö": "oe",
 "ü": "ue",
 "ø": "o",
 "æ": "ae"
```

### Gehasht
<a name="normalization-rule-hashed"></a>
+ **TRIM** = Schneidet führende und nachfolgende Leerzeichen ab

### Quell-ID
<a name="normalization-rule-source-id"></a>
+ **TRIM** = Schneidet führende und nachfolgende Leerzeichen ab

## Normalisierung () ApplyNormalization — Nur ML-basiert
<a name="normalization-ML-defn"></a>

Wählen Sie aus, ob die Eingabedaten wie im Schema definiert normalisiert werden sollen. Bei der Normalisierung werden Daten standardisiert, indem zusätzliche Leerzeichen und Sonderzeichen entfernt und das Format auf Kleinbuchstaben standardisiert wird. 

Wenn ein Eingabefeld beispielsweise den Attributtyp hat und die Werte in der `NAME` Eingabetabelle als formatiert sind`Johns Smith`, AWS Entity Resolution werden die Werte auf normalisiert. `john smith`

In den folgenden Abschnitten werden die Normalisierungsregeln für Matching-Workflows beschrieben, die auf [maschinellem Lernen basieren](#ml-matching-defn).

**Topics**
+ [Name](#normalization-ML-defn-name)
+ [Email](#normalization-ML-defn-email)
+ [Phone](#normalization-ML-defn-phone)

### Name
<a name="normalization-ML-defn-name"></a>
+ **TRIM = Kürzt** führende und nachfolgende Leerzeichen
+ **LOWERCASE** = Alle Alphazeichen werden in Kleinbuchstaben geschrieben

### Email
<a name="normalization-ML-defn-email"></a>
+ **LOWERCASE** = Kleinbuchstaben aller Alphazeichen
+ Ersetzt nur (at) (Groß- und Kleinschreibung beachten) durch ein @-Symbol
+ Entfernt alle Leerzeichen an beliebiger Stelle im Wert 
+ Entfernt alles, was außerhalb des ersten Bereichs liegt, `"<` `>"` falls es existiert

### Phone
<a name="normalization-ML-defn-phone"></a>
+ **TRIM** = Schneidet führende und nachfolgende Leerzeichen ab
+ **REMOVE\$1ALL\$1NON\$1NUMERIC = Entfernt alle nicht-numerischen** Zeichen [0-9]
+ **REMOVE\$1ALL\$1LEADING\$1ZEROES** = Entfernt alle führenden Nullen
+ **ENSURE\$1PREFIX\$1WITH\$1MAP, "" = Untersucht jede Telefonnummer und versucht, sie mit** den Mustern in der abzugleichen. phonePrefixMap phonePrefixMap Wenn eine Übereinstimmung gefunden wird, fügt die Regel das Präfix der Telefonnummer hinzu oder ändert es, um sicherzustellen, dass es dem in der Map angegebenen Standardformat entspricht.

## One-to-One übereinstimmend
<a name="one-to-one-matching-defn"></a>

One-to-one Beim Matching werden einzelne Instanzen ähnlicher Daten verglichen. Eingabefelder mit demselben Abgleichsschlüssel und Werten im selben Eingabefeld werden miteinander abgeglichen. 

Beispielsweise haben Sie möglicherweise mehrere Eingabefelder für Telefonnummern wie `mobile_phone` und`home_phone`, die denselben Abgleichsschlüssel „Telefon“ haben. Verwenden one-to-one Sie den Abgleich, um Daten im `mobile_phone` Eingabefeld mit Daten im `mobile_phone` Eingabefeld zu vergleichen und um Daten im `home_phone` Eingabefeld mit Daten im `home_phone` Eingabefeld zu vergleichen. Daten im `mobile_phone` Eingabefeld werden nicht mit Daten im `home_phone` Eingabefeld verglichen. 

Mit Abgleichsregeln werden Daten in mehreren Eingabefeldern mit demselben Abgleichsschlüssel mit einer (oder) -Operation ausgewertet, und one-to-many beim Abgleich werden Werte innerhalb eines einzelnen Eingabefeldes verglichen. Das heißt, wenn zwei Datensätze `home_phone` mit `mobile_phone` oder übereinstimmen, gibt die Vergleichstaste „Telefon“ eine Übereinstimmung zurück. Für die Suchtaste „Telefon“, um eine Übereinstimmung zu finden, `Record One mobile_phone = Record Two mobile_phone` ODER`Record One home_phone = Record Two home_phone`. 

Abgleichsregeln werten Daten in Eingabefeldern mit unterschiedlichen Zuordnungsschlüsseln mit einer (und) -Operation aus. Wenn Sie möchten, dass beim regelbasierten Abgleich verschiedene Arten von Telefonnummerninformationen vollständig getrennt berücksichtigt werden, können Sie spezifischere Zuordnungsschlüssel wie „mobile\$1phone“ und „home\$1phone“ erstellen. Wenn Sie beide Vergleichstasten in einer Regel verwenden möchten, um Treffer zu finden, UND. `Record One mobile_phone = Record Two mobile_phone` `Record One home_phone = Record Two home_phone`

## Ausgabe
<a name="output-defn"></a>

Eine Liste von **OutputAttribute**Objekten, von denen jedes die Felder **Name** und **Hashed hat.** Jedes dieser Objekte steht für eine Spalte, die in die AWS Glue Ausgabetabelle aufgenommen werden soll, und gibt an, ob die Werte in der Spalte gehasht werden sollen.

## gibt 3Path aus
<a name="output-s3-path"></a>

Das S3-Ziel, in das die AWS Entity Resolution Ausgabetabelle geschrieben wird.

## OutputSourceConfig
<a name="output-source-config"></a>

**Eine Liste von OutputSource Objekten, von denen jedes die Felder **Outputs3Path** und Output hat. **ApplyNormalization****

## Dienstbasiertes Matching auf Anbieterbasis
<a name="provider-service-matching"></a>

Beim Abgleich auf Anbieterdiensten handelt es sich um einen Prozess, bei dem Ihre Datensätze mit bevorzugten Datendienstanbietern und lizenzierten Datensätzen abgeglichen, verknüpft und erweitert werden. Sie müssen über ein Abonnement beim Anbieter AWS Data Exchange verfügen, um diese Abgleichstechnik verwenden zu können.

AWS Entity Resolution ist derzeit in die folgenden Datendienstanbieter integriert: 
+ LiveRamp
+ TransUnion
+ UID 2.0

## Regelbasierter Abgleich
<a name="rule-based-matching-defn"></a>

Beim regelbasierten Abgleich handelt es sich um einen Prozess, der darauf abzielt, exakte Übereinstimmungen zu finden. Beim regelbasierten Abgleich handelt es sich um einen hierarchischen Satz von Wasserfall-Abgleichsregeln, die von Ihnen vorgeschlagen, auf der Grundlage der von AWS Entity Resolution Ihnen eingegebenen Daten vorgeschlagen und vollständig von Ihnen konfiguriert werden können. Alle in den Regelkriterien angegebenen Vergleichsschlüssel müssen exakt übereinstimmen, damit die verglichenen Daten als Treffer deklariert und die zugehörigen Metadaten ausgegeben werden können. Beim regelbasierten Abgleich werden für jeden [übereinstimmenden Datensatz eine Match-ID](#match-id-defin) und eine Regelnummer zurückgegeben.

Wir empfehlen, Regeln zu definieren, mit denen eine Entität eindeutig identifiziert werden kann. Ordnen Sie Ihre Regeln so an, dass zuerst genauere Treffer gefunden werden. 

Nehmen wir zum Beispiel an, Sie haben zwei Regeln, **Regel 1** und **Regel 2.**

Diese Regeln haben die folgenden Zuweisungsschlüssel:
+ **Regel 1** beinhaltet den vollständigen Namen und die Adresse
+ **Regel 2** beinhaltet den vollständigen Namen, die Adresse und die Telefonnummer

Da **Regel 1** zuerst ausgeführt wird, werden nach **Regel 2** keine Treffer gefunden, da sie alle nach **Regel 1** gefunden worden wären.

Um nach Übereinstimmungen zu suchen, die nach Telefonnummer unterschieden werden, ordnen Sie die Regeln wie folgt neu an:
+ **Regel 2** umfasst den vollständigen Namen, die Adresse und die Telefonnummer
+ **Regel 1** beinhaltet den vollständigen Namen und die Adresse

## Schema
<a name="schema-definition"></a>

Der Begriff, der für eine Struktur oder ein Layout verwendet wird, das definiert, wie ein Datensatz organisiert und verknüpft ist.

## Beschreibung des Schemas
<a name="schema-description-defn"></a>

Eine optionale Beschreibung des Schemas, die Sie eingeben können. Beschreibungen helfen Ihnen, zwischen Schemazuordnungen zu unterscheiden, wenn Sie mehr als eine erstellen.

## Name des Schemas
<a name="schema-name-defn"></a>

Der Name des Schemas. 

**Anmerkung**  
Schemanamen müssen eindeutig sein. Sie dürfen nicht denselben Namen haben, da sonst ein Fehler zurückgegeben wird.

## Schemazuordnung
<a name="schema-mapping-definition"></a>

Beim Schema-Mapping in AWS Entity Resolution legen Sie fest, AWS Entity Resolution wie Ihre Daten für den Abgleich zu interpretieren sind. Sie definieren das Schema der Eingabedatentabelle, die Sie in einen Abgleichs-Workflow einlesen möchten AWS Entity Resolution .

## Schemazuordnung ARN
<a name="schema-arn-defn"></a>

Der Amazon-Ressourcenname (ARN), der für die [Schemazuordnung](#schema-mapping-definition) generiert wurde.

## Eindeutige ID
<a name="unique-id-defn"></a>

Eine eindeutige Kennung, die Sie angeben und die jeder Zeile mit Eingabedaten zugewiesen werden muss, die AWS Entity Resolution gelesen wird.

**Example**  
Beispiel: **Primary\$1key**, **Row\$1ID** oder **Record\$1ID**.

Die Spalte „**Eindeutige ID**“ ist erforderlich.

 Die **eindeutige ID** muss ein eindeutiger Bezeichner innerhalb einer einzelnen Tabelle sein. 

Die **eindeutige ID** muss diesem Muster entsprechen: `[a-zA-Z0-9_-]`

In verschiedenen Tabellen kann die **Unique ID** doppelte Werte haben. 

Die maximale Länge der **eindeutigen ID** beträgt 38 für einen [passenden Workflow](#matching-workflow-definition)

Die maximale Länge der **eindeutigen ID** beträgt 257 Zeichen für eine [Arbeitsablauf bei der ID-Zuordnung](#id-mapping-workflow-defn)

Wenn der [passende Workflow](#matching-workflow-definition) ausgeführt wird, wird der Datensatz zurückgewiesen, wenn die **eindeutige ID**:
+ ist nicht angegeben
+ ist innerhalb derselben Tabelle nicht eindeutig
+ überschneidet sich in Bezug auf den Attributnamen zwischen den Quellen
+ mehr als 38 Zeichen (nur bei regelbasierten Matching-Workflows)