Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
ColumnDataType
Vérifie si les valeurs d'une colonne donnée peuvent être converties dans Apache Spark dans le type fourni. Accepte une expression with threshold
pour vérifier la présence d'un sous-ensemble des valeurs de la colonne.
Syntaxe
ColumnDataType
<COL_NAME>
=<EXPECTED_TYPE>
COL_NAME – Nom de la colonne par rapport à laquelle la règle de qualité des données doit être évaluée.
Types de colonnes pris en charge : type de chaîne
Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court
EXPECTED_TYPE : le type attendu des valeurs de la colonne.
Valeurs prises en charge : booléen, date, horodatage, entier, double, flottant, long
Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court
EXPRESSION : une expression facultative pour spécifier le pourcentage de valeurs qui doivent être du type attendu.
Types de colonnes pris en charge : octet, décimal, double, virgule flottante, entier, long, court
Exemple : les entiers de type colonne en tant que chaînes
L'exemple de règle suivant vérifie si les valeurs de la colonne donnée, qui est de type chaîne, peuvent être converties en entiers.
ColumnDataType "colA" = "INTEGER"
Exemple : les entiers de type colonne en tant que chaînes de caractères vérifient un sous-ensemble de valeurs.
L'exemple de règle suivant vérifie si plus de 90 % des valeurs de la colonne donnée, qui est de type chaîne, peuvent être converties en entiers.
ColumnDataType "colA" = "INTEGER" with threshold > 0.9