Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Abbina i dati di input utilizzando un flusso di lavoro corrispondente
Un flusso di lavoro corrispondente è un processo di elaborazione dei dati che combina e confronta i dati provenienti da diverse fonti di input e determina quali record corrispondono in base a diverse tecniche di abbinamento.AWS Entity Resolution legge i dati dalle posizioni specificate, trova le corrispondenze tra i record e assegna un Match ID a ciascun set di dati corrispondente.
Il diagramma seguente riassume come creare un flusso di lavoro corrispondente.
Argomenti
Creazione di un flusso di lavoro di abbinamento basato su regole
Creazione di un flusso di lavoro di abbinamento basato sull'apprendimento automatico
Creazione di un flusso di lavoro di abbinamento basato sui servizi del provider
Modifica o generazione di un Match ID per un flusso di lavoro di abbinamento basato su regole
Ricerca di un Match ID per un flusso di lavoro di abbinamento basato su regole
Eliminazione di record da un flusso di lavoro corrispondente basato su regole o ML
Risoluzione dei problemi relativi ai flussi di lavoro corrispondenti
Tipi di workflow corrispondenti
AWS Entity Resolution supporta tre tipi di flussi di lavoro corrispondenti:
- Abbinamento basato su regole
-
Utilizza regole configurabili per identificare i record corrispondenti in base alla corrispondenza esatta o confusa di campi specificati. I criteri di corrispondenza vengono definiti dall'utente, ad esempio i nomi corrispondenti scritti in modo simile o gli indirizzi formattati in modo diverso.
- Abbinamento basato sull'apprendimento automatico
-
Utilizza modelli di apprendimento automatico per identificare record simili, anche quando i dati presentano variazioni, errori o campi mancanti. Questo approccio è in grado di rilevare corrispondenze più complesse rispetto alla corrispondenza basata su regole.
- Abbinamento basato sui servizi del fornitore
-
Utilizza fornitori di dati di terze parti per arricchire e convalidare i dati prima della corrispondenza. Questo tipo di abbinamento non è compatibile con l'output dei profili dei clienti di Amazon Connect.
Opzioni di output dei dati
AWS Entity Resolution può scrivere file di output di dati su:
-
Una posizione Amazon S3 specificata
-
Profili cliente Amazon Connect (per la deduplicazione dei dati dei clienti)
Importante
L'esportazione nei profili cliente di Amazon Connect non è compatibile con la corrispondenza basata sul provider. Per esportare in Amazon Connect Customer Profiles, devi utilizzare un abbinamento basato su regole o un abbinamento basato sull'apprendimento automatico.
Se lo desideri, puoi AWS Entity Resolution utilizzarlo per eseguire l'hash dei dati di output, aiutandoti a mantenere il controllo sui tuoi dati.
La tabella seguente mostra i tre tipi di flussi di lavoro corrispondenti e le relative destinazioni di output supportate.
| Tipo di corrispondenza | output S3 | Output dei profili dei clienti |
|---|---|---|
| basato su regole | ||
| basato sull'apprendimento automatico | ||
| basato sui servizi del provider |
Risultati del flusso di lavoro corrispondenti
Dopo aver creato ed eseguito un flusso di lavoro corrispondente, puoi visualizzare i risultati nella località S3 specificata o nei profili cliente Amazon Connect. I flussi di lavoro corrispondenti vengono generati IDs dopo l'indicizzazione dei dati.
Un workflow corrispondente può avere più esecuzioni e i risultati (successi o errori) vengono scritti in una cartella con il jobId nome.
Per ogni esecuzione per le destinazioni di output S3:
-
L'output dei dati contiene sia un file per le corrispondenze riuscite sia un file per gli errori
-
I risultati positivi vengono scritti in una
successcartella contenente più file -
Gli errori vengono scritti in una
errorcartella con più campi
Per ogni esecuzione per le destinazioni di output dei profili dei clienti Amazon Connect:
-
I record dei clienti deduplicati vengono inviati direttamente alla tua istanza Amazon Connect
-
Puoi visualizzare la cronologia delle tue attività lavorative recenti nella console AWS Entity Resolution
-
I profili esistenti in Amazon Connect non sono inclusi nel processo di deduplicazione
Dopo aver creato ed eseguito un flusso di lavoro corrispondente, puoi utilizzare l'output della corrispondenza basata su regole o del machine learning (ML) come input per la corrispondenza basata sui servizi del provider o viceversa per soddisfare le tue esigenze aziendali.
Ad esempio, per risparmiare sui costi di abbonamento del provider, puoi innanzitutto eseguire la corrispondenza basata su regole per trovare le corrispondenze nei tuoi dati. Quindi, puoi inviare un sottoinsieme di record non corrispondenti alla corrispondenza basata sui servizi del provider. Tieni presente che se prevedi di esportare in Customer Profiles, dovresti utilizzare solo la corrispondenza basata su regole o basata sull'apprendimento automatico.
Per ulteriori informazioni sulla risoluzione degli errori, vedere. Risoluzione dei problemi relativi ai flussi di lavoro corrispondenti