Cocokkan data input menggunakan alur kerja yang cocok - Resolusi Entitas AWS

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Cocokkan data input menggunakan alur kerja yang cocok

Alur kerja yang cocok adalah pekerjaan pemrosesan data yang menggabungkan dan membandingkan data dari sumber input yang berbeda dan menentukan catatan mana yang cocok berdasarkan teknik pencocokan yang berbeda.Resolusi Entitas AWS membaca data Anda dari lokasi yang ditentukan, menemukan kecocokan antar catatan, dan menetapkan ID Pencocokan ke setiap kumpulan data yang cocok.

Diagram berikut merangkum cara membuat alur kerja yang cocok.

A summary of the four steps to create a matching workflow in Resolusi Entitas AWS

Jenis alur kerja yang cocok

Resolusi Entitas AWS mendukung tiga jenis alur kerja yang cocok:

Pencocokan berbasis aturan

Menggunakan aturan yang dapat dikonfigurasi untuk mengidentifikasi catatan yang cocok berdasarkan pencocokan yang tepat atau kabur dari bidang tertentu. Anda menentukan kriteria yang cocok, seperti nama yang cocok yang dieja sama atau alamat yang diformat berbeda.

Pencocokan berbasis pembelajaran mesin

Menggunakan model pembelajaran mesin untuk mengidentifikasi catatan serupa, bahkan ketika data memiliki variasi, kesalahan, atau bidang yang hilang. Pendekatan ini dapat mendeteksi kecocokan yang lebih kompleks daripada pencocokan berbasis aturan.

Pencocokan berbasis layanan penyedia

Menggunakan penyedia data pihak ketiga untuk memperkaya dan memvalidasi data Anda sebelum mencocokkan. Jenis pencocokan ini tidak kompatibel dengan keluaran Amazon Connect Customer Profiles.

Opsi keluaran data

Resolusi Entitas AWS dapat menulis file output data ke:

  • Lokasi Amazon S3 yang Anda tentukan

  • Profil Pelanggan Amazon Connect (untuk deduplikasi data pelanggan)

penting

Mengekspor ke Profil Pelanggan Amazon Connect tidak kompatibel dengan pencocokan berbasis penyedia. Untuk mengekspor ke Profil Pelanggan Amazon Connect, Anda harus menggunakan pencocokan berbasis aturan atau pencocokan berbasis pembelajaran mesin.

Anda dapat menggunakan Resolusi Entitas AWS untuk hash data output jika diinginkan - membantu Anda mempertahankan kontrol atas data Anda.

Tabel berikut menunjukkan tiga jenis alur kerja yang cocok dan tujuan output yang didukung.

Jenis pencocokan Keluaran S3 Output Profil Pelanggan
berbasis aturan Ya Ya
berbasis pembelajaran mesin Ya Ya
penyedia layanan berbasis Ya Tidak

Mencocokkan hasil alur kerja

Setelah membuat dan menjalankan alur kerja yang cocok, Anda dapat melihat hasilnya di lokasi S3 yang ditentukan atau di Profil Pelanggan Amazon Connect. Alur kerja yang cocok dihasilkan IDs setelah data diindeks.

Alur kerja yang cocok dapat memiliki beberapa proses dan hasilnya (keberhasilan atau kesalahan) ditulis ke folder dengan nama jobId sebagai.

Untuk setiap proses untuk tujuan keluaran S3:

  • Output data berisi file untuk kecocokan yang berhasil dan file untuk kesalahan

  • Hasil yang berhasil ditulis ke success folder yang berisi banyak file

  • Kesalahan ditulis ke error folder dengan beberapa bidang

Untuk setiap proses untuk tujuan keluaran Amazon Connect Customer Profiles:

  • Catatan pelanggan yang tidak digandakan dikirim langsung ke instans Amazon Connect

  • Anda dapat melihat riwayat pekerjaan terbaru Anda di Resolusi Entitas AWS konsol

  • Profil yang ada di Amazon Connect tidak termasuk dalam proses deduplikasi

Setelah Anda membuat dan menjalankan alur kerja yang cocok, Anda dapat menggunakan output pencocokan berbasis aturan atau pencocokan pembelajaran mesin (ML) sebagai masukan untuk pencocokan berbasis layanan penyedia atau sebaliknya untuk memenuhi kebutuhan bisnis Anda.

Misalnya, untuk menghemat biaya berlangganan penyedia, Anda dapat menjalankan pencocokan berbasis aturan terlebih dahulu untuk menemukan kecocokan pada data Anda. Kemudian, Anda dapat mengirim subset catatan yang tak tertandingi ke pencocokan berbasis layanan penyedia. Perhatikan bahwa jika Anda berencana untuk mengekspor ke Profil Pelanggan, Anda harus menggunakan pencocokan berbasis aturan atau pembelajaran mesin saja.

Untuk informasi selengkapnya tentang kesalahan pemecahan masalah, lihat. Memecahkan masalah alur kerja yang cocok