Types de flux de travail correspondants Options de sortie de données Résultats du flux de travail correspondants

Faire correspondre les données d’entrée à l’aide d’un flux de travail de mise en relation

Un flux de travail de correspondance est une tâche de traitement des données qui combine et compare les données provenant de différentes sources d'entrée et détermine quels enregistrements correspondent en fonction de différentes techniques de correspondance. Résolution des entités AWS lit vos données à partir des emplacements que vous avez spécifiés, trouve des correspondances entre les enregistrements et attribue un identifiant de correspondance à chaque ensemble de données correspondant.

Le schéma suivant explique comment créer un flux de travail correspondant.

A summary of the four steps to create a matching workflow in Résolution des entités AWS

Rubriques

Types de flux de travail correspondants

Résolution des entités AWS prend en charge trois types de flux de travail correspondants :

Rule-based correspondance: Utilise des règles configurables pour identifier les enregistrements correspondants en fonction de la correspondance exacte ou floue des champs spécifiés. Vous définissez les critères de correspondance, tels que les noms correspondants orthographiés de la même manière ou les adresses mises en forme différemment.
Correspondance par machine learning: Utilise des modèles d'apprentissage automatique pour identifier des enregistrements similaires, même lorsque les données présentent des variations, des erreurs ou des champs manquants. Cette approche permet de détecter des correspondances plus complexes que les correspondances basées sur des règles.
Correspondance basée sur les services des fournisseurs: Fait appel à des fournisseurs de données tiers pour enrichir et valider vos données avant leur mise en correspondance. Ce type de correspondance n'est pas compatible avec la sortie Connect Customer Customer Profiles.

Options de sortie de données

Résolution des entités AWS peut écrire des fichiers de sortie de données dans :

Un emplacement Amazon S3 que vous spécifiez
Connect Customer Customer Customer Profiles (pour la déduplication des données clients)

Important

L'exportation vers Connect Customer Customer Profiles n'est pas compatible avec la mise en correspondance basée sur le fournisseur. Pour exporter vers Connect Customer Customer Profiles, vous devez utiliser une correspondance basée sur des règles ou une correspondance basée sur l'apprentissage automatique.

Vous pouvez l'utiliser Résolution des entités AWS pour hacher les données de sortie si vous le souhaitez, ce qui vous permet de garder le contrôle de vos données.

Le tableau suivant présente les trois types de flux de travail correspondants et leurs destinations de sortie prises en charge.

Type correspondant	sortie S3	Sortie des profils clients
basé sur des règles	Oui	Oui
basé sur l'apprentissage automatique	Oui	Oui
basé sur les services du fournisseur	Oui	Non

Résultats du flux de travail correspondants

Après avoir créé et exécuté un flux de travail correspondant, vous pouvez consulter les résultats dans l'emplacement S3 que vous avez spécifié ou dans les profils clients Connect Customer. Les flux de travail correspondants génèrent des identifiants une fois les données indexées.

Un flux de travail correspondant peut comporter plusieurs exécutions et les résultats (réussites ou erreurs) sont écrits dans un dossier portant le jobId nom.

Pour chaque exécution pour les destinations de sortie S3 :

La sortie de données contient à la fois un fichier pour les correspondances réussies et un fichier pour les erreurs
Les résultats positifs sont écrits success dans un dossier contenant plusieurs fichiers
Les erreurs sont enregistrées error dans un dossier contenant plusieurs champs

Pour chaque exécution de Connect Customer Customer Profiles, destinations de sortie :

Les dossiers clients dédupliqués sont envoyés directement à votre instance Connect Customer
Vous pouvez consulter l'historique de vos dernières tâches dans la Résolution des entités AWS console
Les profils existants dans Connect Customer ne sont pas inclus dans le processus de déduplication

Après avoir créé et exécuté un flux de travail de mise en correspondance, vous pouvez utiliser le résultat de la mise en correspondance basée sur des règles ou de l'apprentissage automatique (ML) comme entrée pour la mise en correspondance basée sur les services des fournisseurs ou inversement pour répondre aux besoins de votre entreprise.

Par exemple, pour réduire les coûts d'abonnement des fournisseurs, vous pouvez d'abord exécuter une correspondance basée sur des règles pour trouver des correspondances dans vos données. Vous pouvez ensuite envoyer un sous-ensemble d'enregistrements sans correspondance au jumelage basé sur les services du fournisseur. Notez que si vous envisagez d'exporter vers des profils clients, vous devez utiliser uniquement des correspondances basées sur des règles ou sur l'apprentissage automatique.

Pour plus d'informations sur la résolution des erreurs, consultezRésolution des problèmes liés aux workflows correspondants.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Ajouter ou mettre à jour une politique de ressources pour un espace de noms d'ID

Création d'un flux de travail de correspondance basé sur des règles