Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Classe MonthName
La transformation MonthName crée une colonne contenant le nom du mois, à partir d’une chaîne représentant une date.
exemple
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) spark.conf.set("spark.sql.legacy.timeParserPolicy", "LEGACY") input_df = spark.createDataFrame( [ ("20-2018-12",), ("2018-20-12",), ("20182012",), ("12202018",), ("20122018",), ("20-12-2018",), ("12/20/2018",), ("02/02/02",), ("02 02 2009",), ("02/02/2009",), ("August/02/2009",), ("02/june/2009",), ("02/2020/june",), ("2013-02-21 06:35:45.658505",), ("August 02 2009",), ("2013/02/21",), (None,), ], ["column_1"], ) try: df_output = datetime_functions.MonthName.apply( data_frame=input_df, spark_context=sc, source_column="column_1", target_column="target_column" ) df_output.show() except: print("Unexpected Error happened ") raise
Sortie
Le résultat sera :
``` +------------+------------+ | column_1|target_column| +------------+------------+ |20-2018-12 | December | |2018-20-12 | null | | 20182012| null | | 12202018| null | | 20122018| null | |20-12-2018 | December | |12/20/2018 | December | | 02/02/02 | February | |02 02 2009 | February | |02/02/2009 | February | |August/02/2009| August | |02/june/2009| null | |02/2020/june| null | |2013-02-21 06:35:45.658505| February | |August 02 2009| August | | 2013/02/21| February | | null | null | +------------+------------+ ```
La transformation MonthName prend la valeur `source_column` `"column_1"` et la valeur `target_column` `"target_column"`. Elle tente d’extraire le nom du mois à partir des chaînes de date/heure de la colonne `"column_1"` et le place dans la colonne `"target_column"`. Si la chaîne date/heure est dans un format inconnu ou ne peut pas être analysée, la valeur `"target_column"` est définie sur `null`.
La transformation extrait correctement le nom du mois à partir de différents formats de date/heure, tels que « 20-12-2018 », « 12/20/2018 », « 02/02/2009 », « 2013-02-21 06:35:45.658505 » et « 2 août 2009 ».
Méthodes
__call__(spark_context, data_frame, target_column, source_column=None, value=None)
La transformation MonthName crée une colonne contenant le nom du mois, à partir d’une chaîne représentant une date.
-
source_column: nom d’une colonne existante. -
value: chaîne de caractères à évaluer. -
target_column: nom de la colonne qui vient d’être créée.
apply(cls, *args, **kwargs)
Hérité de GlueTransform s'appliquent.
name(cls)
Hérité de GlueTransform name.
describeArgs(cls)
Hérité de GlueTransform describeArgs.
describeReturn(cls)
Hérité de GlueTransform describeReturn.
describeTransform(cls)
Hérité de GlueTransform describeTransform.
describeErrors(cls)
Hérité de GlueTransform describeErrors.
describe(cls)
Hérité de GlueTransform describe.