Classe FormatCase
A transformação FormatCase altera cada string em uma coluna para o tipo de caso especificado.
Exemplo
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise
Saída
A transformação FormatCase converterá os valores na coluna "cidade" em minúsculas com base no parâmetro ‘case_type="lower"`. O DataFrame "df_output" resultante conterá todas as colunas do DataFrame "datasource1" original, mas com os valores da coluna "cidade" em minúsculas.
Métodos
__call__(spark_context, data_frame, source_column, case_type)
A transformação FormatCase altera cada string em uma coluna para o tipo de caso especificado.
-
source_column: o nome de uma coluna existente. -
case_type: os tipos de casos compatíveis sãoCAPITAL,LOWER,UPPEReSENTENCE.
aplicar(cls, *args, **kwargs)
Herdado de GlueTransform apply.
name(cls)
Herdado de GlueTransform nome.
describeArgs(cls)
Herdado de GlueTransform describeArgs.
describeReturn(cls)
Herdado de GlueTransform describeReturn.
describeTransform(cls)
Herdado de GlueTransform describeTransform.
describeErrors(cls)
Herdado de GlueTransform describeErrors.
describe(cls)
Herdado de GlueTransform describe.