Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Associez les données d'entrée à l'aide d'un flux de travail correspondant
Un flux de travail de mise en correspondance est une tâche de traitement des données qui combine et compare les données provenant de différentes sources d'entrée et détermine quels enregistrements correspondent en fonction de différentes techniques de correspondance.Résolution des entités AWS lit vos données à partir des emplacements que vous avez spécifiés, trouve des correspondances entre les enregistrements et attribue un identifiant de correspondance à chaque ensemble de données correspondant.
Le schéma suivant explique comment créer un flux de travail correspondant.
Rubriques
Création d'un flux de travail de correspondance basé sur des règles
Création d'un flux de travail de correspondance basé sur le machine learning
Création d'un flux de travail de correspondance basé sur les services des fournisseurs
Recherche d'un identifiant de match pour un flux de travail de correspondance basé sur des règles
Types de flux de travail correspondants
Résolution des entités AWS prend en charge trois types de flux de travail correspondants :
- Correspondance basée sur des règles
-
Utilise des règles configurables pour identifier les enregistrements correspondants en fonction de la correspondance exacte ou floue des champs spécifiés. Vous définissez les critères de correspondance, tels que les noms correspondants orthographiés de la même manière ou les adresses mises en forme différemment.
- Correspondance basée sur le machine learning
-
Utilise des modèles d'apprentissage automatique pour identifier des enregistrements similaires, même lorsque les données présentent des variations, des erreurs ou des champs manquants. Cette approche permet de détecter des correspondances plus complexes que les correspondances basées sur des règles.
- Correspondance basée sur les services des fournisseurs
-
Fait appel à des fournisseurs de données tiers pour enrichir et valider vos données avant de les associer. Ce type de correspondance n'est pas compatible avec les résultats des profils clients Amazon Connect.
Options de sortie de données
Résolution des entités AWS peut écrire des fichiers de sortie de données dans :
-
Un emplacement Amazon S3 que vous spécifiez
-
Profils clients Amazon Connect (pour la déduplication des données clients)
Important
L'exportation vers les profils clients Amazon Connect n'est pas compatible avec la mise en correspondance basée sur les fournisseurs. Pour exporter vers Amazon Connect Customer Profiles, vous devez utiliser une correspondance basée sur des règles ou une correspondance basée sur le machine learning.
Vous pouvez l'utiliser Résolution des entités AWS pour hacher les données de sortie si vous le souhaitez, ce qui vous permet de garder le contrôle de vos données.
Le tableau suivant présente les trois types de flux de travail correspondants et leurs destinations de sortie prises en charge.
| Type correspondant | sortie S3 | Sortie des profils clients |
|---|---|---|
| basé sur des règles | ||
| basé sur l'apprentissage automatique | ||
| basé sur les services du fournisseur |
Résultats du flux de travail correspondants
Après avoir créé et exécuté un flux de travail correspondant, vous pouvez consulter les résultats dans l'emplacement S3 que vous avez spécifié ou dans les profils des clients Amazon Connect. Les flux de travail correspondants sont générés une IDs fois les données indexées.
Un flux de travail correspondant peut comporter plusieurs exécutions et les résultats (réussites ou erreurs) sont écrits dans un dossier portant le jobId nom.
Pour chaque exécution pour les destinations de sortie S3 :
-
La sortie de données contient à la fois un fichier pour les correspondances réussies et un fichier pour les erreurs
-
Les résultats positifs sont écrits
successdans un dossier contenant plusieurs fichiers -
Les erreurs sont enregistrées
errordans un dossier contenant plusieurs champs
Pour chaque exécution pour les destinations de sortie des profils clients Amazon Connect :
-
Les dossiers clients dédupliqués sont envoyés directement à votre instance Amazon Connect
-
Vous pouvez consulter l'historique de vos dernières tâches dans la Résolution des entités AWS console
-
Les profils existants dans Amazon Connect ne sont pas inclus dans le processus de déduplication
Après avoir créé et exécuté un flux de travail de mise en correspondance, vous pouvez utiliser le résultat de la mise en correspondance basée sur des règles ou de l'apprentissage automatique (ML) comme entrée pour la mise en correspondance basée sur les services des fournisseurs ou inversement pour répondre aux besoins de votre entreprise.
Par exemple, pour réduire les coûts d'abonnement des fournisseurs, vous pouvez d'abord exécuter une correspondance basée sur des règles pour trouver des correspondances dans vos données. Vous pouvez ensuite envoyer un sous-ensemble d'enregistrements sans correspondance au jumelage basé sur les services du fournisseur. Notez que si vous envisagez d'exporter vers des profils clients, vous devez utiliser uniquement des correspondances basées sur des règles ou sur l'apprentissage automatique.
Pour plus d'informations sur la résolution des erreurs, consultezRésolution des problèmes liés aux workflows correspondants.