Abfrage-Editoren: Verwendung JupyterLab mit Aurora DSQL - Amazon Aurora DSQL

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Abfrage-Editoren: Verwendung JupyterLab mit Aurora DSQL

Dieses Handbuch enthält step-by-step Anweisungen zur Verbindung und Abfrage von Amazon Aurora DSQL JupyterLab mithilfe von Python. JupyterLab ist eine beliebte interaktive Computerumgebung, die Code, Text und Visualisierungen in einem einzigen Dokument kombiniert. Sie wird häufig für datenwissenschaftliche und Forschungsanwendungen verwendet.

Die folgenden Anweisungen behandeln die Grundlagen der Verwendung von Aurora DSQL sowohl bei einer lokalen Installation JupyterLab als auch bei der Verwendung von Amazon SageMaker AI, einem vollständig verwalteten Service für maschinelles Lernen, der eine gehostete Umgebung mit einer Benutzeroberfläche für Datenworkflows bietet.

Erste Schritte

Voraussetzungen

  • Ein Aurora DSQL-Cluster

  • AWS-Anmeldeinformationen konfiguriert (nur lokale Installation)

  • Python-Version 3.9 oder höher (nur lokale Installation)

Lokal verwenden JupyterLab

Um damit zu beginnen JupyterLab, müssen Benutzer zuerst die Anwendung mit Pythons Pip installieren:

pip install jupyterlab

JupyterLab kann dann durch Ausführen jupyter lab geöffnet werden. Dadurch wird die JupyterLab Anwendung unter localhost:8888 geöffnet, auf die in einem Browser zugegriffen werden kann. Stellen Sie sicher, dass Sie AWS-Anmeldeinformationen in Ihrer lokalen Umgebung konfiguriert haben, bevor Sie fortfahren.

Amazon SageMaker AI verwenden

Gehen Sie in der AWS-Konsole zur Amazon SageMaker AI-Konsolenseite und dann zum Abschnitt Notebooks unter Anwendungen und IDEs. Von dort aus können Sie Notebook-Instance erstellen auswählen, um mit der Erstellung einer SageMaker Umgebung zu beginnen. Wählen Sie einen Instanztyp und eine Plattform aus, bevor Sie auf Notebook-Instanz erstellen klicken.

Weitere Informationen zur Einrichtung und zu den Instance-Optionen finden Sie in der Amazon SageMaker AI-Setup-Dokumentation.

Anmerkung

Warnung: Die Verwendung von Amazon SageMaker AI kann zu Gebühren für Ihr AWS-Konto führen.

Sobald die SageMaker Instance aktiv ist, können Sie sie im Bereich Notebook-Instances mit Öffnen öffnen JupyterLab. Bevor Sie mit Aurora DSQL in Ihrem Notebook beginnen, müssen Sie in der IAM-Rolle der SageMaker Instanz Zugriff auf Ihren DSQL-Cluster gewähren. Der einfachste Weg, dies zu tun, besteht darin, dem Link zur IAM-Rolle auf der Notebook-Instanzseite zu folgen. Von dort aus können Sie die mit Ihrer SageMaker IAM-Rolle verknüpften Richtlinien bearbeiten. Weitere Informationen zur Konfiguration einer IAM-Richtlinie für den Zugriff auf Aurora DSQL finden Sie unter Authentifizierung und Autorisierung.

Verbindung zu Aurora DSQL herstellen mit JupyterLab

Nachdem Sie eine JupyterLab Instanz eingerichtet haben, sind die Schritte zum Herstellen einer Verbindung mit Aurora DSQL lokal und in SageMaker AI identisch. Erstellen Sie ein leeres Python 3-Notizbuch, in dem Sie Zellen mit Python-Code hinzufügen können.

Laden Sie in einer Python-Zelle das Amazon-Stammzertifikat aus dem offiziellen Trust Store herunter:

import urllib.request urllib.request.urlretrieve('https://www.amazontrust.com/repository/AmazonRootCA1.pem', 'root.pem')

Um eine Verbindung zu Aurora DSQL herzustellen, installieren Sie zuerst den Aurora DSQL Connector für Python und den Psycopg-Treiber in einer Python-Zelle und importieren Sie ihn dann:

pip install aurora_dsql_python_connector psycopg
import aurora_dsql_psycopg as dsql

Nachdem der Konnektor importiert wurde, können Sie dann eine DSQL-Konfiguration erstellen und eine Verbindung herstellen. Der Aurora DSQL Python Connector übernimmt automatisch die Erstellung eines Authentifizierungstokens für jede Verbindung.

config = { 'host': "your-cluster.dsql.us-east-1.on.aws", 'region': "us-east-1", 'user': "admin" } conn = dsql.connect(**config)

Nachdem Sie Ihren Code ausgeführt haben, sollten Sie jetzt eine Psycopg-Verbindung zu Aurora DSQL haben. Sie können dann Abfragen mit dem Psycopg-Cursor ausführen und Ihre SQL-Abfrage angeben. Weitere Informationen zur Verwendung von Psycopg mit einer Postgres-kompatiblen Datenbank finden Sie in der Psycopg-Dokumentation. Diese Abfrage führt zu einer Liste von Tupeln in. results_list

with conn: with conn.cursor() as cur: cur.execute("SELECT * FROM table") results_list = cur.fetchall()

Sie können dann Python-Frameworks wie Pandas verwenden, um Ihre Abfrageergebnisse zu analysieren oder zu visualisieren, zum Beispiel:

pip install pandas import pandas as pd df = pd.DataFrame(tuples_list) print(df) print(f"Total records: {len(df)}")

Beispiel für ein Notizbuch

Ein Beispielnotizbuch mit Aurora DSQL ist im Aurora DSQL Samples Repository verfügbar.

Weitere Informationen

Dokumentation zur Einrichtung von Amazon SageMaker AI

Aurora DSQL-Konnektor für Python

Pandas-Dokumentation