Beispiel Ausgabe – Methoden –__call__apply Name describeArgs describeReturn describeTransform describeErrors Beschreiben

MonthName Klasse

Die MonthName-Transformation erstellt eine neue Spalte mit dem Namen des Monats aus einer Zeichenfolge, die ein Datum darstellt.

Beispiel


from pyspark.context import SparkContext
from pyspark.sql import SparkSession
from awsgluedi.transforms import *

sc = SparkContext()
spark = SparkSession(sc)

spark.conf.set("spark.sql.legacy.timeParserPolicy", "LEGACY")

input_df = spark.createDataFrame(
    [
        ("20-2018-12",),
        ("2018-20-12",),
        ("20182012",),
        ("12202018",),
        ("20122018",),
        ("20-12-2018",),
        ("12/20/2018",),
        ("02/02/02",),
        ("02 02 2009",),
        ("02/02/2009",),
        ("August/02/2009",),
        ("02/june/2009",),
        ("02/2020/june",),
        ("2013-02-21 06:35:45.658505",),
        ("August 02 2009",),
        ("2013/02/21",),
        (None,),
    ],
    ["column_1"],
)

try:
    df_output = datetime_functions.MonthName.apply(
        data_frame=input_df,
        spark_context=sc,
        source_column="column_1",
        target_column="target_column"
    )
    df_output.show()
except:
    print("Unexpected Error happened ")
    raise

Ausgabe

Die Ausgabe ist:


```
+------------+------------+
| column_1|target_column|
+------------+------------+
|20-2018-12 | December |
|2018-20-12 | null |
| 20182012| null |
| 12202018| null |
| 20122018| null |
|20-12-2018 | December |
|12/20/2018 | December |
| 02/02/02 | February |
|02 02 2009 | February |
|02/02/2009 | February |
|August/02/2009| August |
|02/june/2009| null |
|02/2020/june| null |
|2013-02-21 06:35:45.658505| February |
|August 02 2009| August |
| 2013/02/21| February |
| null | null |
+------------+------------+
```

Die MonthName-Transformation verwendet `source_column` als `"column_1"` und `target_column` als `"target_column"`. Sie versucht, den Monatsnamen aus den date/time Zeichenketten in der Spalte `"column_1"` zu extrahieren und platziert ihn in der Spalte `"target_column"`. Falls die date/time Zeichenfolge ein unbekanntes Format hat oder nicht analysiert werden kann, wird der Wert `"target_column"` auf `null` gesetzt.

Die Transformation extrahiert erfolgreich den Monatsnamen aus verschiedenen date/time Formaten wie „20-12-2018“, „20.12.2018“, „02.02.2009“, „21.02.2013 06:35:45.658 505“ und „02. August 2009“.

call(spark_context, data_frame, target_column, source_column=None, value=None)

Die MonthName-Transformation erstellt eine neue Spalte mit dem Namen des Monats aus einer Zeichenfolge, die ein Datum darstellt.

source_column – Der Name einer vorhandenen Spalte.
value – Eine auszuwertende Zeichenfolge.
target_column – Ein Name für die neu erstellte Spalte.

apply(cls, *args, **kwargs)

Geerbt von GlueTransform apply.

name(cls)

Geerbt von GlueTransform Name.

describeArgs(cls)

Geerbt von GlueTransform describeArgs.

describeReturn(cls)

Geerbt von GlueTransform describeReturn.

describeTransform(cls)

Geerbt von GlueTransform describeTransform.

describeErrors(cls)

Geerbt von GlueTransform describeErrors.

describe(cls)

Geerbt von GlueTransform Beschreiben.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

RemoveDuplicates

IsEven