Programmieren von ETL-Skripts für AWS Glue in PySpark - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Programmieren von ETL-Skripts für AWS Glue in PySpark

Sie finden Codebeispiele von Python und Dienstprogramme für AWS Glue im AWS Glue samples repository (Repository mit AWS-Glue-Beispielen) auf der GitHub-Website.

Verwenden von Python mit AWS Glue

AWS Glue unterstützt eine Erweiterung des PySpark-Python-Dialekts für Skriptsprache von ETL-Aufträgen (Extract, Transform, Load (ETL). Dieser Abschnitt beschreibt die Verwendung von Python in ETL-Skripts und mit der AWS-Glue-API.

AWS-Glue-PySpark-Erweiterungen

AWS Glue hat die folgenden Erweiterungen für den PySpark-Python-Dialekt erstellt.

AWS-Glue-PySpark-Transformationen

AWS Glue hat die folgenden Transformationsklassen erstellt, die in PySpark-ETL-Operationen verwendet werden können.