Erste Schritte mit AWS Glue interaktiven Sitzungen - AWS Glue

Erste Schritte mit AWS Glue interaktiven Sitzungen

In diesen Abschnitten wird die lokale Ausführung von AWS Glue interaktiven Sitzungen beschrieben.

Voraussetzungen für die lokale Einrichtung von interaktiven Sitzungen

Für die Installation interaktiver Sitzungen gelten folgende Voraussetzungen:

  • Unterstützte Python-Versionen sind 3.6 – 3.10+.

  • Anweisungen für MacOS/Linux und Windows finden Sie in den folgenden Abschnitten.

  • Lesen Sie die Preisdokumentation für interaktive Sitzungen, um die Kostenstruktur zu verstehen.

Installieren von Jupyter und AWS Glue-interaktiven Jupyter-Sitzungs-Kernels

Verwenden Sie Folgendes, um den Kernel lokal zu installieren.

Der Befehl install-glue-kernels installiert die Jupyter-Kernelspezifikation sowohl für den Pyspark- als auch den Spark-Kernel und installiert außerdem Logos im richtigen Verzeichnis.

pip3 install --upgrade jupyter boto3 aws-glue-sessions
install-glue-kernels

Ausführen von Jupyter

Führen Sie die folgenden Schritte aus, um Jupyter Notebook auszuführen.

  1. Führen Sie zum Starten von Jupyter Notebook den folgenden Befehl aus.

    jupyter notebook
  2. Klicken Sie auf Neu und danach auf einen der AWS Glue-Kernel, um mit dem Coding gegen AWS Glue zu beginnen.

Konfigurieren der Anmeldeinformationen und der Region für die Sitzung

MacOS/Linux-Anweisungen

AWS Glue-interaktive Sitzungen erfordern dieselben IAM-Berechtigungen wie AWS Glue-Aufträge und Entwicklungsendpunkte. Sie können die Rolle, die mit interaktiven Sitzungen verwendet wird, auf zwei Arten angeben:

  1. Mit der %iam_role und mit %region-Magics

  2. Mit einer zusätzlichen Zeile in ~/.aws/config

Configuring a session role with magic (Konfigurieren einer Sitzungsrolle mit Magic)

Geben Sie in der ersten ausgeführten Zelle den Wert %iam_role <YourGlueServiceRole> ein.

Konfigurieren einer Sitzungsrolle mit ~/.aws/config

Die AWS Glue-Servicerolle für interaktiven Sitzungen kann entweder im Notebook selbst angegeben oder mit der AWS CLI-Konfiguration gespeichert werden. Verwenden Sie hierfür die Rolle, die Sie normalerweise für AWS Glue-Aufträge nutzen. Wenn Sie keine Rolle für AWS Glue-Aufträge haben, folgen Sie bitte dem Leitfaden Einrichten von IAM-Berechtigungen für AWS Glue, um eine zu erstellen.

So legen Sie diese Rolle als Standardrolle für interaktive Sitzungen fest:

  1. Öffnen Sie ~/.aws/config in einem Texteditor.

  2. Suchen Sie nach dem Profil, das Sie für AWS Glue verwenden. Wenn Sie kein Profil verwenden, verwenden Sie das [Default]-Profil.

  3. Fügen Sie im Profil eine Zeile für die Rolle hinzu, die Sie verwenden möchten, z. B. glue_role_arn=<AWSGlueServiceRole>.

  4. [Optional]: Wenn für Ihr Profil keine Standardregion festgelegt ist, sollten Sie eine mit region=us-east-1 hinzufügen und us-east-1 durch die gewünschte Region ersetzen.

  5. Speichern Sie die Konfiguration.

Weitere Informationen finden Sie unter Interaktive Sitzungen mit IAM.

Anweisungen für Windows

AWS Glue-interaktive Sitzungen erfordern dieselben IAM-Berechtigungen wie AWS Glue-Aufträge und Entwicklungsendpunkte. Sie können die Rolle, die mit interaktiven Sitzungen verwendet wird, auf zwei Arten angeben:

  1. Mit der %iam_role und mit %region-Magics

  2. Mit einer zusätzlichen Zeile in ~/.aws/config

Configuring a session role with magic (Konfigurieren einer Sitzungsrolle mit Magic)

Geben Sie in der ersten ausgeführten Zelle den Wert %iam_role <YourGlueServiceRole> ein.

Konfigurieren einer Sitzungsrolle mit ~/.aws/config

Die AWS Glue-Servicerolle für interaktiven Sitzungen kann entweder im Notebook selbst angegeben oder mit der AWS CLI-Konfiguration gespeichert werden. Verwenden Sie hierfür die Rolle, die Sie normalerweise für AWS Glue-Aufträge nutzen. Wenn Sie keine Rolle für AWS Glue-Aufträge haben, folgen Sie bitte dem Leitfaden Einrichten von IAM-BerechtigungenAWS Glue, um eine zu erstellen.

So legen Sie diese Rolle als Standardrolle für interaktive Sitzungen fest:

  1. Öffnen Sie ~/.aws/config in einem Texteditor.

  2. Suchen Sie nach dem Profil, das Sie für AWS Glue verwenden. Wenn Sie kein Profil verwenden, verwenden Sie das [Default]-Profil.

  3. Fügen Sie im Profil eine Zeile für die Rolle hinzu, die Sie verwenden möchten, z. B. glue_role_arn=<AWSGlueServiceRole>.

  4. [Optional]: Wenn für Ihr Profil keine Standardregion festgelegt ist, sollten Sie eine mit region=us-east-1 hinzufügen und us-east-1 durch die gewünschte Region ersetzen.

  5. Speichern Sie die Konfiguration.

Weitere Informationen finden Sie unter Interaktive Sitzungen mit IAM.

Aktualisieren aus der Vorschau der interaktiven Sitzungen

Der Kernel wurde mit neuen Namen aktualisiert, als er mit Version 0.27 veröffentlicht wurde. Um Vorschauversionen der Kernel zu bereinigen, führen Sie Folgendes in einem Terminal oder in PowerShell aus.

Anmerkung

Wenn Sie Teil einer anderen AWS Glue-Vorschau sind, die ein benutzerdefiniertes Service-Modell erfordert, wird durch das Entfernen des Kernels auch das benutzerdefinierte Service-Modell entfernt.

# Remove Old Glue Kernels jupyter kernelspec remove glue_python_kernel jupyter kernelspec remove glue_scala_kernel # Remove Custom Model cd ~/.aws/models rm -rf glue/