Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
ColumnDataType
Memeriksa apakah nilai dalam kolom tertentu dapat dilemparkan di Apache Spark ke jenis yang disediakan. Menerima with threshold
ekspresi untuk memeriksa subset nilai di kolom.
Sintaksis
ColumnDataType
<COL_NAME>
=<EXPECTED_TYPE>
COL_NAME — Nama kolom yang ingin Anda evaluasi terhadap aturan kualitas data.
Jenis kolom yang didukung: Jenis string
Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek
EXPECTED_TYPE — Jenis nilai yang diharapkan di kolom.
Nilai yang didukung: Boolean, Date, Timestamp, Integer, Double, Float, Long
Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek
EKSPRESI - Ekspresi opsional untuk menentukan persentase nilai yang harus dari tipe yang diharapkan.
Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek
Contoh: Kolom tipe data bilangan bulat sebagai string
Contoh aturan berikut memeriksa apakah nilai-nilai dalam kolom yang diberikan, yang bertipe string, dapat dilemparkan sebagai bilangan bulat.
ColumnDataType "colA" = "INTEGER"
Contoh: Kolom tipe data bilangan bulat sebagai string memeriksa subset dari nilai
Contoh aturan berikut memeriksa apakah lebih dari 90% nilai dalam kolom yang diberikan, yang bertipe string, dapat dilemparkan sebagai bilangan bulat.
ColumnDataType "colA" = "INTEGER" with threshold > 0.9