FormatCase-Klasse
Die FormatCase-Transformation wandelt jede Zeichenfolge in einer Spalte in den angegebenen Groß-/Kleinschreibungstyp um.
Beispiel
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise
Output
Die FormatCase-Transformation wandelt die Werte in der Spalte `city` basierend auf dem Parameter `case_type="lower"` in Kleinbuchstaben um. Der resultierende DataFrame `df_output` enthält alle Spalten des ursprünglichen DataFrame `datasource1`, jedoch mit den Werten der Spalte `city` in Kleinbuchstaben.
Methoden
__call__(spark_context, data_frame, source_column, case_type)
Die FormatCase-Transformation wandelt jede Zeichenfolge in einer Spalte in den angegebenen Groß-/Kleinschreibungstyp um.
-
source_column– Der Name einer vorhandenen Spalte. -
case_type– Unterstützte Groß-/Kleinschreibungstyp sindCAPITAL,LOWER,UPPER,SENTENCE.
apply(cls, *args, **kwargs)
Geerbt von GlueTransform apply.
name(cls)
Geerbt von GlueTransform Name.
describeArgs(cls)
Geerbt von GlueTransform describeArgs.
describeReturn(cls)
Geerbt von GlueTransform describeReturn.
describeTransform(cls)
Geerbt von GlueTransform describeTransform.
describeErrors(cls)
Geerbt von GlueTransform describeErrors.
describe(cls)
Geerbt von GlueTransform Beschreiben.