ColumnDataType - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

ColumnDataType

Prüft, ob die Werte in einer bestimmten Spalte in Apache Spark in den angegebenen Typ umgewandelt werden können. Akzeptiert einen with threshold-Ausdruck zur Prüfung auf eine Teilmenge der Werte in der Spalte.

Syntax

ColumnDataType <COL_NAME> = <EXPECTED_TYPE>
  • COL_NAME – Der Name der Spalte, anhand der Sie die Datenqualitätsregel auswerten möchten.

    Unterstützte Spaltentypen: Zeichenfolgentyp

    Unterstützte Spaltentypen: Byte, Dezimal, Doppelt, Gleitkommazahl, Ganzzahl, Lang, Kurz

  • EXPECTED_TYPE – Der erwartete Typ der Werte in der Spalte.

    Unterstützte Werte: Boolean, Date, Timestamp, Integer, Double, Float, Long

    Unterstützte Spaltentypen: Byte, Dezimal, Doppelt, Gleitkommazahl, Ganzzahl, Lang, Kurz

  • EXPRESSION – Ein optionaler Ausdruck zur Angabe des Prozentsatzes der Werte, die vom erwarteten Typ sein sollen.

    Unterstützte Spaltentypen: Byte, Dezimal, Doppelt, Gleitkommazahl, Ganzzahl, Lang, Kurz

Beispiel: Spaltendatentyp-Ganzzahlen als Zeichenfolgen

Die folgende Beispielregel prüft, ob die Werte in der angegebenen Spalte, die vom Typ string ist, als Ganzzahlen umgewandelt werden können.

ColumnDataType "colA" = "INTEGER"

Beispiel: Spaltendatentyp-Ganzzahlen als Zeichenfolgen prüfen, ob eine Teilmenge der Werte vorhanden ist

Die folgende Beispielregel prüft, ob mehr als 90% der Werte in der angegebenen Spalte, die vom Typ Zeichenfolge ist, als Ganzzahlen umgewandelt werden können.

ColumnDataType "colA" = "INTEGER" with threshold > 0.9