

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Pemeriksaan kualitas data
<a name="data-quality-checks"></a>

Kualitas data merupakan bagian integral namun sering diabaikan dari proses pembersihan data. Diagram berikut menunjukkan bagaimana pemeriksaan kualitas data sesuai dengan otomatisasi rekayasa data dan siklus hidup kontrol akses.

![\[Diagram kualitas data\]](http://docs.aws.amazon.com/id_id/prescriptive-guidance/latest/modern-data-centric-use-cases/images/data_quality_checks.png)


Tabel berikut memberikan ikhtisar solusi kualitas data yang berbeda berdasarkan kasus penggunaan.


|  |  |  | 
| --- |--- |--- |
| **Kasus penggunaan** | **Solusi** | **Contoh** | 
| Solusi tanpa kode untuk menambahkan kondisi kualitas tingkat kolom atau tingkat tabel | [AWS Glue DataBrew](https://aws.amazon.com/glue/features/databrew/) | Memeriksa apakah semua nilai kolom antara 1 dan 12, atau jika tabel atau kolom kosong | 
| Kode khusus ditambahkan ke pekerjaan AWS Glue atau solusi tanpa kode (dalam pratinjau) untuk menambahkan kondisi kualitas tingkat kolom atau tingkat tabel | [Kualitas Data AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/glue-data-quality.html) | Memeriksa `first_name` apakah kolom tidak nol, atau jika kolom hanya `phone_number` berisi angka atau fungsi and/or statistik operator “\$1”, seperti rata-rata atau jumlah | 
| Pemeriksaan kustom | [ETL pilihan, seperti [AWS Lambda, AWS](https://aws.amazon.com/lambda/)[Glue, atau Amazon EMR](https://aws.amazon.com/glue/)](https://aws.amazon.com/emr/) | Memeriksa apakah nilai kolom A selalu lebih besar dari nilai kolom B dan kolom C yang sesuai, atau jika nilai kolom selalu `continent` benar secara geografis dan berasal dari kolom `city` | 
| Solusi canggih dengan laporan metrik, validasi kendala, dan saran kendala | [Deequ](https://aws.amazon.com/blogs/big-data/test-data-quality-at-scale-with-deequ/) | Memeriksa apakah `CompletenessConstraint` untuk Kelengkapan metrik kolom sama `review_id` dengan `1` | 