ColumnDataType - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

ColumnDataType

Vérifie si les valeurs d'une colonne donnée peuvent être converties dans Apache Spark dans le type fourni. Accepte une expression with threshold pour vérifier la présence d'un sous-ensemble des valeurs de la colonne.

Syntaxe

ColumnDataType <COL_NAME> = <EXPECTED_TYPE>
  • COL_NAME – Nom de la colonne par rapport à laquelle la règle de qualité des données doit être évaluée.

    Types de colonnes pris en charge : type de chaîne

    Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court

  • EXPECTED_TYPE : le type attendu des valeurs de la colonne.

    Valeurs prises en charge : booléen, date, horodatage, entier, double, flottant, long

    Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court

  • EXPRESSION : une expression facultative pour spécifier le pourcentage de valeurs qui doivent être du type attendu.

    Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court

Exemple : les entiers de type colonne en tant que chaînes

L'exemple de règle suivant vérifie si les valeurs de la colonne donnée, qui est de type chaîne, peuvent être converties en entiers.

ColumnDataType "colA" = "INTEGER"

Exemple : les entiers de type colonne en tant que chaînes de caractères vérifient un sous-ensemble de valeurs.

L'exemple de règle suivant vérifie si plus de 90 % des valeurs de la colonne donnée, qui est de type chaîne, peuvent être converties en entiers.

ColumnDataType "colA" = "INTEGER" with threshold > 0.9