FormatCase-Klasse - AWS Glue

FormatCase-Klasse

Die FormatCase-Transformation wandelt jede Zeichenfolge in einer Spalte in den angegebenen Groß-/Kleinschreibungstyp um.

Beispiel

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise

Output

Die FormatCase-Transformation wandelt die Werte in der Spalte `city` basierend auf dem Parameter `case_type="lower"` in Kleinbuchstaben um. Der resultierende DataFrame `df_output` enthält alle Spalten des ursprünglichen DataFrame `datasource1`, jedoch mit den Werten der Spalte `city` in Kleinbuchstaben.

Methoden

__call__(spark_context, data_frame, source_column, case_type)

Die FormatCase-Transformation wandelt jede Zeichenfolge in einer Spalte in den angegebenen Groß-/Kleinschreibungstyp um.

  • source_column – Der Name einer vorhandenen Spalte.

  • case_type – Unterstützte Groß-/Kleinschreibungstyp sind CAPITAL, LOWER, UPPER, SENTENCE.

apply(cls, *args, **kwargs)

Geerbt von GlueTransform apply.

name(cls)

Geerbt von GlueTransform Name.

describeArgs(cls)

Geerbt von GlueTransform describeArgs.

describeReturn(cls)

Geerbt von GlueTransform describeReturn.

describeTransform(cls)

Geerbt von GlueTransform describeTransform.

describeErrors(cls)

Geerbt von GlueTransform describeErrors.

describe(cls)

Geerbt von GlueTransform Beschreiben.