Spark-Skripte in der AWS Glue-Konsole bearbeiten

Ein Skript enthält den Code, der Daten aus Quellen extrahiert, umwandelt und in Ziele lädt. AWS Glue führt ein Skript aus, wenn es einen Auftrag startet.

ETL-Skripts in AWS Glue können in Python oder Scala codiert werden. Python-Skripts verwenden eine Sprache, die eine Erweiterung des PySpark Python-Dialekts für ETL (Extract, Transform and Load)-Aufträge darstellt. Das Skript enthält erweiterte Konstrukte für die Verarbeitung von ETL-Transformationen. Wenn Sie die Quellcodelogik für Ihren Auftrag automatisch generieren, wird ein Skript erstellt. Sie können dieses Skript bearbeiten oder Ihr eigenes Skript zur Verarbeitung Ihrer ETL-Vorgänge bereitstellen.

Informationen zum Definieren und Bearbeiten von Skripts in AWS Glue finden Sie unter AWS Glue-Programmierhandbuch.

Zusätzliche Bibliotheken oder Dateien

Wenn Ihr Skript zusätzliche Bibliotheken oder Dateien erfordert, können Sie sie wie folgt angeben:

Python-Bibliothekspfad: Durch Komma getrennte Amazon Simple Storage Service (Amazon S3)-Pfade zu den Python-Bibliotheken, die das Skript erfordert.

Anmerkung
Es können nur reine Python-Bibliotheken verwendet werden. Bibliotheken, die auf C-Erweiterungen basieren, wie zum Beispiel die Python Data Analysis Library von Panda , werden noch nicht unterstützt.
Abhängiger Jars-Pfad: Durch Komma getrennte Amazon-S3-Pfade zu JAR-Dateien, die vom Skript benötigt werden.

Anmerkung
Derzeit können nur reine Java- oder Scala (2.11)-Bibliotheken verwendet werden.
Pfad für referenzierte Dateien: Durch Komma getrennte Amazon-S3-Pfade zu zusätzlichen Dateien (z. B. Konfigurationsdateien), die das Skript erfordert.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Konfigurieren von Spark-Auftragseigenschaften

Aufgräge (veraltet)

Spark-Skripte in der AWS Glue-Konsole bearbeiten

Zusätzliche Bibliotheken oder Dateien

Anmerkung

Anmerkung