Einen regelbasierten Abgleichsworkflow erstellen - AWS Entity Resolution

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einen regelbasierten Abgleichsworkflow erstellen

Der regelbasierte Abgleich ist ein hierarchischer Satz von Wasserfall-Abgleichsregeln, die von Ihnen vorgeschlagen werden AWS Entity Resolution, auf der Grundlage der von Ihnen eingegebenen Daten vorgeschlagen werden und von Ihnen vollständig konfiguriert werden können. Der regelbasierte Abgleichs-Workflow ermöglicht es Ihnen, Klartext- oder Hash-Daten zu vergleichen, um anhand von von Ihnen angepassten Kriterien exakte Übereinstimmungen zu finden.

Wenn eine AWS Entity Resolution Übereinstimmung zwischen zwei oder mehr Datensätzen in Ihren Daten gefunden wird, wird Folgendes zugewiesen:

  • Den Datensätzen im abgeglichenen Datensatz wird eine Match-ID zugewiesen

  • Die Vergleichsregel, die den Treffer generiert hat.

Um einen regelbasierten Abgleichs-Workflow zu erstellen
  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die AWS Entity Resolution Konsole unter. https://console.aws.amazon.com/entityresolution/

  2. Wählen Sie im linken Navigationsbereich unter Workflows die Option Matching aus.

  3. Wählen Sie auf der Seite Abgleichende Workflows in der oberen rechten Ecke die Option Passenden Workflow erstellen aus.

  4. Gehen Sie für Schritt 1: Passende Workflow-Details angeben wie folgt vor:

    1. Geben Sie einen passenden Workflow-Namen und optional eine Beschreibung ein.

    2. Wählen Sie für Dateneingabe eine AWS Glue Datenbank aus der Dropdownliste, wählen Sie die AWS Glue Tabelle und dann die entsprechende Schemazuordnung aus.

      Sie können bis zu 19 Dateneingaben hinzufügen.

    3. Die Option Daten normalisieren ist standardmäßig ausgewählt, sodass Dateneingaben vor dem Abgleich normalisiert werden. Wenn Sie Daten nicht normalisieren möchten, deaktivieren Sie die Option Daten normalisieren.

      Anmerkung

      Die Normalisierung wird nur für die folgenden Szenarien unter Schema-Mapping erstellen unterstützt:

      • Wenn die folgenden Namensuntertypen gruppiert sind: Vorname, Zweiter Vorname, Nachname.

      • Wenn die folgenden Adressuntertypen gruppiert sind: Straße 1, Straße 2, Straße 3, Stadt, Bundesland, Land, Postleitzahl.

      • Wenn die folgenden Telefonuntertypen gruppiert sind: Telefonnummer, Landesvorwahl des Telefons.

    4. Um die Zugriffsberechtigungen für den Dienst festzulegen, wählen Sie eine Option und ergreifen Sie die empfohlene Maßnahme.

      Option Empfohlene Aktion
      Erstellen und verwenden Sie eine neue Servicerolle
      • AWS Entity Resolution erstellt eine Servicerolle mit der erforderlichen Richtlinie für diese Tabelle.

      • Der Standardname der Servicerolle lautetentityresolution-matching-workflow-<timestamp>.

      • Sie müssen über die erforderlichen Berechtigungen verfügen, um Rollen zu erstellen und Richtlinien anzuhängen.

      • Wenn Ihre Eingabedaten verschlüsselt sind, wählen Sie die Option Diese Daten werden mit einem KMS-Schlüssel verschlüsselt. Geben Sie dann einen AWS KMS Schlüssel ein, der zum Entschlüsseln Ihrer Dateneingabe verwendet wird.

      Verwenden Sie eine vorhandene Servicerolle
      1. Wählen Sie einen vorhandenen Servicerollennamen aus der Dropdownliste aus.

        Die Liste der Rollen wird angezeigt, wenn Sie berechtigt sind, Rollen aufzulisten.

        Wenn Sie nicht berechtigt sind, Rollen aufzulisten, können Sie den Amazon-Ressourcennamen (ARN) der Rolle eingeben, die Sie verwenden möchten.

        Wenn es keine vorhandenen Servicerollen gibt, ist die Option „Eine bestehende Servicerolle verwenden“ nicht verfügbar.

      2. Rufen Sie die Servicerolle auf, indem Sie auf den externen Link In IAM anzeigen klicken.

        Versucht standardmäßig AWS Entity Resolution nicht, die bestehende Rollenrichtlinie zu aktualisieren, um die erforderlichen Berechtigungen hinzuzufügen.

    5. (Optional) Um Tags für die Ressource zu aktivieren, wählen Sie Neues Tag hinzufügen aus und geben Sie dann das Schlüssel - und Wertepaar ein.

    6. Wählen Sie Weiter aus.

  5. Für Schritt 2: Passende Technik wählen:

    1. Wählen Sie unter Abgleichmethode die Option Regelbasierter Abgleich aus.

      Wählen Sie den Bildschirm „Abgleichstechnik“ mit Optionen für regelbasiertes und maschinelles Lernen.
    2. Wählen Sie für den Verarbeitungsrhythmus eine der folgenden Optionen aus:

      • Wählen Sie Manuell, um bei Bedarf einen Workflow für ein Massenupdate auszuführen

      • Wählen Sie Automatisch, um einen Workflow auszuführen, sobald sich neue Daten in Ihrem S3-Bucket befinden

      Anmerkung

      Wenn Sie Automatisch wählen, stellen Sie sicher, dass Sie EventBridge Amazon-Benachrichtigungen für Ihren S3-Bucket aktiviert haben. Anweisungen zur Aktivierung EventBridge von Amazon mithilfe der S3-Konsole finden Sie unter Enabling Amazon EventBridge im Amazon S3 S3-Benutzerhandbuch.

    3. (Optional) Wählen Sie Nur für ID-Zuordnung für Index aktivieren aus, wenn Sie den passenden Workflow als Quelle oder Ziel in einem ID-Mapping-Workflow verwenden möchten. AWS Entity Resolution indexiert die Daten nur und generiert sie nicht IDs.

      Standardmäßig werden passende Workflows generiert, IDs nachdem die Daten indexiert wurden.

    4. Geben Sie für Abgleichsregeln einen Regelnamen ein und wählen Sie dann die Option Abgleichsschlüssel für diese Regel aus.

      Sie können bis zu 15 Regeln erstellen und bis zu 15 verschiedene Abgleichsschlüssel auf Ihre Regeln anwenden, um Vergleichskriterien zu definieren.

      Benutzeroberfläche für Abgleichsregeln mit Feldern zur Eingabe des Regelnamens und zur Auswahl von Vergleichsschlüsseln.
    5. Wählen Sie Weitere Regel hinzufügen, um bei Bedarf weitere Regeln zu erstellen.

    6. Wählen Sie als Vergleichstyp eine der folgenden Optionen aus:

      • Wählen Sie Mehrere Eingabefelder, um eine beliebige Kombination von Übereinstimmungen in Daten zu finden, die in mehreren Eingabefeldern gespeichert sind.

      • Wählen Sie Einzelnes Eingabefeld, um den Vergleich auf ein einzelnes Eingabefeld zu beschränken.

      Optionen für den Vergleichstyp: Mehrere Eingabefelder, um Übereinstimmungen zwischen Daten zu finden, die in mehreren Feldern gespeichert sind, oder Einzelnes Eingabefeld, um den Vergleich innerhalb eines Felds einzuschränken.
    7. Wählen Sie Weiter aus.

  6. Für Schritt 3: Datenausgabe und Format angeben:

    1. Wählen Sie für Datenausgabeziel und -format den Amazon S3 S3-Speicherort für die Datenausgabe und ob das Datenformat Normalisierte Daten oder Originaldaten sein soll.

    2. Wenn Sie unter Verschlüsselung die Verschlüsselungseinstellungen anpassen wählen, geben Sie den AWS KMS Schlüssel ARN ein.

    3. Sehen Sie sich die vom System generierte Ausgabe an.

    4. Entscheiden Sie für die Datenausgabe, welche Felder Sie einschließen, ausblenden oder maskieren möchten, und wählen Sie dann eine der folgenden Optionen aus:

      • Behalten Sie den Ausgabestatus „Eingeschlossen“ bei, um Felder einzubeziehen.

      • Wählen Sie das Ausgabefeld und dann Ausblenden, um Felder auszublenden (von der Ausgabe ausschließen)

      • Wählen Sie das Ausgabefeld und dann Hash-Ausgabe aus, um Felder zu maskieren.

      • Wählen Sie „Zurücksetzen“, um die vorherigen Einstellungen zurückzusetzen.

    5. Wählen Sie Weiter aus.

  7. Für Schritt 4: Überprüfen und erstellen:

    1. Überprüfen Sie die Auswahlen, die Sie für die vorherigen Schritte getroffen haben, und bearbeiten Sie sie gegebenenfalls.

    2. Wählen Sie Create and run aus.

      Es wird eine Meldung angezeigt, die darauf hinweist, dass der passende Workflow erstellt und der Job gestartet wurde.

  8. Sehen Sie sich auf der Seite mit den entsprechenden Workflow-Details auf der Registerkarte Metriken unter Metriken für den letzten Job Folgendes an:

    • Die Job-ID.

    • Der Status des passenden Workflow-Jobs: In Warteschlange, In Bearbeitung, Abgeschlossen, Fehlgeschlagen

    • Die Zeit, in der der Workflow-Job abgeschlossen wurde.

    • Die Anzahl der verarbeiteten Datensätze.

    • Die Anzahl der nicht verarbeiteten Datensätze.

    • Das IDs generierte eindeutige Match.

    • Die Anzahl der Eingabedatensätze.

    Sie können auch die Job-Metriken für übereinstimmende Workflow-Jobs, die zuvor ausgeführt wurden, unter dem Jobverlauf anzeigen.

  9. Nachdem der passende Workflow-Job abgeschlossen ist (Status ist Abgeschlossen), können Sie zur Registerkarte Datenausgabe wechseln und dann Ihren Amazon S3 S3-Standort auswählen, um die Ergebnisse anzuzeigen.

  10. (Nur manueller Verarbeitungstyp) Wenn Sie einen regelbasierten Abgleichs-Workflow mit dem Verarbeitungstyp Manuell erstellt haben, können Sie den Abgleichs-Workflow jederzeit ausführen, indem Sie auf der Seite mit den entsprechenden Workflow-Details die Option Workflow ausführen wählen.