FormatPhoneNumber 類別 - AWS Glue

FormatPhoneNumber 類別

FormatPhoneNumber 轉換會傳回一個資料欄,其中電話號碼字串會轉換為格式化值。

範例

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [ ("408-341-5669",), ("4083415669",) ], ["phone"], ) try: df_output = column_formatting.FormatPhoneNumber.apply( data_frame=input_df, spark_context=sc, source_column="phone", default_region="US" ) df_output.show() except: print("Unexpected Error happened ") raise

輸出

輸出將是:

``` +---------------+ | phone| +---------------+ |(408) 341-5669| |(408) 341-5669| +---------------+ ```

FormatPhoneNumber 轉換會將 `source_column` 作為 `"phone"`,並將 `default_region` 作為 `"US"`。

無論電話號碼的初始格式為何,轉換都會成功將這兩個電話號碼格式化為標準美國格式 `(408) 341-5669`。

方法

__call__(spark_context, data_frame, source_column, phone_number_format=None, default_region=None, default_region_column=None)

FormatPhoneNumber 轉換會傳回一個資料欄,其中電話號碼字串會轉換為格式化值。

  • source_column – 現有資料欄的名稱。

  • phone_number_format – 將電話號碼轉換為的格式。如果未指定格式,預設值為 E.164,這是國際認可的標準電話號碼格式。有效值包括以下項目:

    • E164 (省略 E 後的句點)

  • default_region – 由兩個或三個大寫字母組成的有效區域代碼,當號碼本身沒有國家/地區代碼時,用於指定電話號碼所在的區域。最多可以提供 defaultRegiondefaultRegionColumn 之一。

  • default_region_column – 進階資料類型 Country 的資料欄名稱。當號碼本身沒有國家/地區代碼時,所指定資料欄中的區域代碼用於確定電話號碼的國家/地區代碼。最多可以提供 defaultRegiondefaultRegionColumn 之一。

apply(cls, *args, **kwargs)

繼承自 GlueTransform apply

name(cls)

繼承自 GlueTransform name

describeArgs(cls)

繼承自 GlueTransform describeArgs

describeReturn(cls)

繼承自 GlueTransform describeReturn

describeTransform(cls)

繼承自 GlueTransform describeTransform

describeErrors(cls)

繼承自 GlueTransform describeErrors

describe(cls)

繼承自 GlueTransform describe