Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
IpToInt-Klasse
Die IpToInt-Transformation konvertiert den IPv4-Wert (Internet Protocol Version 4) der Quellspalte oder einen anderen Wert in den entsprechenden Ganzzahlwert in der Zielspalte und gibt das Ergebnis in einer neuen Spalte zurück.
Beispiel
Für AWS Glue 4.0 und höher erstellen oder aktualisieren Sie Auftragsargumente mit key: --enable-glue-di-transforms, value: true
from pyspark.context import SparkContext from awsgluedi.transforms import * sc = SparkContext() input_df = spark.createDataFrame( [ ("192.0.0.1",), ("10.10.10.10",), ("1.2.3.4",), ("1.2.3.6",), ("http://12.13.14.15",), ("https://16.17.18.19",), ("1.2.3.4",), (None,), ("abc",), ("abc.abc.abc.abc",), ("321.123.123.123",), ("244.4.4.4",), ("255.255.255.255",), ], ["source_column_ip"], ) df_output = web_functions.IpToInt.apply( data_frame=input_df, spark_context=sc, source_column="source_column_ip", target_column="target_column", value=None ) df_output.show()
Output
Die Ausgabe ist:
``` +----------------+---------------+ |source_column_ip| target_column| +----------------+---------------+ | 192.0.0.1| 3221225473| | 10.10.10.10| 168427722| | 1.2.3.4| 16909060| | 1.2.3.6| 16909062| |http://12.13.14.15| null| |https://16.17.18.19| null| | 1.2.3.4| 16909060| | null| null| | abc| null| |abc.abc.abc.abc| null| | 321.123.123.123| null| | 244.4.4.4| 4102444804| | 255.255.255.255| 4294967295| +----------------+---------------+ ```
Die IpToInt-Transformation verwendet „source_column“ als „source_column_ip“ und „target_column“ als „target_column“ und konvertiert die gültigen IPv4-Adresszeichenfolgen in der Spalte „source_column_ip“ in ihre entsprechende 32-Bit-Ganzzahldarstellung und speichert das Ergebnis in der Spalte „target_column“.
Für gültige IPv4-Adresszeichenfolgen (z. B. „192.0.0.1", „10.10.10", „1.2.3.4") konvertiert die Transformation sie erfolgreich in ihre Ganzzahldarstellung (z. B. 3221225473, 168427722, 16909060). Für Zeichenfolgen, die keine gültigen IPv4-Adressen sind (z. B. URLs, Nicht-IP-Zeichenfolgen wie „abc“, ungültige IP-Formate wie „abc.abc.abc.abc“), wird der Wert in „target_column“ auf „null“ gesetzt. Für „null“-Werte in der Spalte „source_column_ip“ wird der Wert in „target_column“ ebenfalls auf „null“ gesetzt.
Methoden
__call__(spark_context, data_frame, target_column, source_column=None, value=None)
Die IpToInt-Transformation konvertiert den IPv4-Wert (Internet Protocol Version 4) der Quellspalte oder einen anderen Wert in den entsprechenden Ganzzahlwert in der Zielspalte und gibt das Ergebnis in einer neuen Spalte zurück.
-
sourceColumn– Der Name einer vorhandenen Spalte. -
value– Eine auszuwertende Zeichenfolge. -
targetColumn– Der Name der neuen Spalte, die erstellt werden soll.
apply(cls, *args, **kwargs)
Geerbt von GlueTransform apply.
name(cls)
Geerbt von GlueTransform Name.
describeArgs(cls)
Geerbt von GlueTransform describeArgs.
describeReturn(cls)
Geerbt von GlueTransform describeReturn.
describeTransform(cls)
Geerbt von GlueTransform describeTransform.
describeErrors(cls)
Geerbt von GlueTransform describeErrors.
describe(cls)
Geerbt von GlueTransform Beschreiben.