Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Classe FormatCase
La trasformazione FormatCase modifica ogni stringa di una colonna applicando la formattazione specificata.
Esempio
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise
Output
La trasformazione FormatCase convertirà i valori nella colonna `city` in lettere minuscole in base al parametro `case_type=“LOWER”`. Il DataFrame `df_output` risultante conterrà tutte le colonne del DataFrame originale `datasource1`, ma con i valori della colonna `city` in lettere minuscole.
Metodi
__call__(spark_context, data_frame, source_column, case_type)
La trasformazione FormatCase modifica ogni stringa di una colonna applicando la formattazione specificata.
-
source_column: il nome di una colonna esistente. -
case_type: i tipi di formattazione supportati sonoCAPITAL,LOWER,UPPER,SENTENCE.
apply(cls, *args, **kwargs)
Ereditato da GlueTransform apply.
name(cls)
Ereditato da GlueTransform nome.
describeArgs(cls)
Ereditato da GlueTransform describeArgs.
describeReturn(cls)
Ereditato da GlueTransform describeReturn.
describeTransform(cls)
Ereditato da GlueTransform describeTransform.
describeErrors(cls)
Ereditato da GlueTransform describeErrors.
describe(cls)
Ereditato da GlueTransform describe.