ColumnDataType - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

ColumnDataType

Memeriksa apakah nilai dalam kolom tertentu dapat dilemparkan di Apache Spark ke jenis yang disediakan. Menerima with threshold ekspresi untuk memeriksa subset nilai di kolom.

Sintaksis

ColumnDataType <COL_NAME> = <EXPECTED_TYPE>
  • COL_NAME — Nama kolom yang ingin Anda evaluasi terhadap aturan kualitas data.

    Jenis kolom yang didukung: Jenis string

    Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek

  • EXPECTED_TYPE — Jenis nilai yang diharapkan di kolom.

    Nilai yang didukung: Boolean, Date, Timestamp, Integer, Double, Float, Long

    Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek

  • EKSPRESI - Ekspresi opsional untuk menentukan persentase nilai yang harus dari tipe yang diharapkan.

    Jenis kolom yang didukung: Byte, Desimal, Ganda, Float, Integer, Panjang, Pendek

Contoh: Kolom tipe data bilangan bulat sebagai string

Contoh aturan berikut memeriksa apakah nilai-nilai dalam kolom yang diberikan, yang bertipe string, dapat dilemparkan sebagai bilangan bulat.

ColumnDataType "colA" = "INTEGER"

Contoh: Kolom tipe data bilangan bulat sebagai string memeriksa subset dari nilai

Contoh aturan berikut memeriksa apakah lebih dari 90% nilai dalam kolom yang diberikan, yang bertipe string, dapat dilemparkan sebagai bilangan bulat.

ColumnDataType "colA" = "INTEGER" with threshold > 0.9