IsEven-Klasse
Die IsEven-Transformation gibt einen booleschen Wert in einer neuen Spalte zurück, der angibt, ob die Quellspalte oder der Wert gerade ist. Wenn die Quellspalte oder der Wert eine Dezimalzahl ist, ist das Ergebnis falsch.
Beispiel
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [(5,), (0,), (-1,), (2,), (None,)], ["source_column"], ) try: df_output = math_functions.IsEven.apply( data_frame=input_df, spark_context=sc, source_column="source_column", target_column="target_column", value=None, true_string="Even", false_string="Not even", ) df_output.show() except: print("Unexpected Error happened ") raise
Output
Die Ausgabe ist:
``` +------------+------------+ |source_column|target_column| +------------+------------+ | 5| Not even| | 0| Even| | -1| Not even| | 2| Even| | null| null| +------------+------------+ ```
Die IsEven-Transformation verwendet die „source_column“ als „source_column“ und die „target_column“ als „target_column“. Sie prüft, ob der Wert in der „source_column“ eine gerade Zahl ist oder nicht. Wenn der Wert gerade ist, wird der Wert „target_column“ auf den Wert „true_string“ „Even“ gesetzt. Wenn der Wert ungerade ist, wird der Wert „target_column“ auf „false_string“ „Not even“ gesetzt. Falls der Wert „source_column“ „null“ ist, wird der Wert „target_column“ auf „null“ gesetzt.
Die Transformation identifiziert die geraden Zahlen (0 und 2) korrekt und setzt den Wert „target_column“ auf „Even“. Für ungerade Zahlen (5 und -1) wird der Wert „target_column“ auf „Not even“ gesetzt. Für den Wert „null“ in „source_column“ wird der Wert „target_column“ auf „null“ gesetzt.
Methoden
__call__(spark_context, data_frame, target_column, source_column=None, true_string=DEFAULT_TRUE_STRING, false_string=DEFAULT_FALSE_STRING, value=None)
Die IsEven-Transformation gibt einen booleschen Wert in einer neuen Spalte zurück, der angibt, ob die Quellspalte oder der Wert gerade ist. Wenn die Quellspalte oder der Wert eine Dezimalzahl ist, ist das Ergebnis falsch.
-
source_column– Der Name einer vorhandenen Spalte. -
target_column– Der Name der neuen Spalte, die erstellt werden soll. -
true_string– Eine Zeichenfolge, die angibt, ob der Wert gerade ist. -
false_string– Eine Zeichenfolge, die angibt, ob der Wert ungerade ist.
apply(cls, *args, **kwargs)
Geerbt von GlueTransform apply.
name(cls)
Geerbt von GlueTransform Name.
describeArgs(cls)
Geerbt von GlueTransform describeArgs.
describeReturn(cls)
Geerbt von GlueTransform describeReturn.
describeTransform(cls)
Geerbt von GlueTransform describeTransform.
describeErrors(cls)
Geerbt von GlueTransform describeErrors.
describe(cls)
Geerbt von GlueTransform Beschreiben.