Summe - AWS Glue

Summe

Prüft die Summe aller Werte in einer Spalte anhand eines bestimmten Ausdrucks.

Syntax

Sum <COL_NAME> <EXPRESSION>
  • COL_NAME – Der Name der Spalte, anhand der Sie die Datenqualitätsregel auswerten möchten.

    Unterstützte Spaltentypen: Byte, Dezimal, Doppelt, Gleitkommazahl, Ganzzahl, Lang, Kurz

  • AUSDRUCK – Ein Ausdruck, der für die Antwort des Regeltyps ausgeführt wird, um einen booleschen Wert zu erzeugen. Weitere Informationen finden Sie unter Ausdrücke.

Beispiel: Summe

Die folgende Beispielregel prüft, ob die Summe aller Werte in einer Spalte einen bestimmten Schwellenwert überschreitet.

Sum "transaction_total" > 500000 Sum "Salary" < 55600 where "Customer_ID < 10"

Beispiel für dynamische Regeln

  • Sum "ColA" > avg(last(10))

  • Sum "colA" between min(last(10)) - 1 and max(last(10)) + 1

Nullverhalten

Die Sum-Regel ignoriert Zeilen mit NULL-Werten bei der Berechnung der Summe. Zum Beispiel:

+---+-----------+ |id |units | +---+-----------+ |100|0 | |101|null | |102|20 | |103|null | |104|40 | +---+-----------+

Bei der Summe der Spalte units werden die Zeilen 101 und 103 nicht berücksichtigt und das Ergebnis ist (0 + 20 + 40) = 60.