Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
FormatCase kelas
FormatCaseTransformasi mengubah setiap string dalam kolom ke jenis kasus yang ditentukan.
Contoh
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise
Output
FormatCaseTransformasi akan mengubah nilai di kolom `city` menjadi huruf kecil berdasarkan parameter `case_type="lower"`. Hasil `df_output` DataFrame akan berisi semua kolom dari `datasource1` asli, tetapi dengan nilai kolom DataFrame `city` dalam huruf kecil.
Metode
__call__ (spark_context, data_frame, source_column, case_type)
FormatCaseTransformasi mengubah setiap string dalam kolom ke jenis kasus yang ditentukan.
-
source_column— Nama kolom yang ada. -
case_type— Jenis kasus yang didukung adalahCAPITAL,LOWER,UPPER,SENTENCE.
apply(cls, *args, **kwargs)
Warisan dari GlueTransform apply.
name(cls)
Warisan dari GlueTransform name.
describeArgs(cls)
Warisan dari GlueTransform describeArgs.
describeReturn(cls)
Warisan dari GlueTransform describeReturn.
describeTransform(cls)
Warisan dari GlueTransform describeTransform.
describeErrors(cls)
Warisan dari GlueTransform describeErrors.
describe(cls)
Warisan dari GlueTransform describe.