Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Éditeurs de requêtes : utilisation JupyterLab avec Aurora DSQL
Ce guide fournit des step-by-step instructions sur la façon de connecter et d'interroger Amazon Aurora DSQL à l' JupyterLab aide de Python. JupyterLab est un environnement informatique interactif populaire qui combine du code, du texte et des visualisations dans un seul document. Il est largement utilisé pour les applications de science des données et de recherche.
Les instructions ci-dessous décrivent les principes de base de l'utilisation d'Aurora DSQL dans le cadre d'une installation locale et dans le JupyterLab cadre de l'utilisation d'Amazon SageMaker AI, un service d'apprentissage automatique entièrement géré qui fournit un environnement hébergé avec une interface utilisateur pour les flux de travail de données.
Prise en main
Exigences
-
Un cluster SQL Aurora
-
Informations d'identification AWS configurées (installation locale uniquement)
-
Python version 3.9 ou supérieure (installation locale uniquement)
Utilisation du local JupyterLab
Pour commencer JupyterLab, les utilisateurs doivent d'abord installer l'application en utilisant le pip de Python :
pip install jupyterlab
JupyterLab peut ensuite être ouvert en courantjupyter lab. Cela ouvrira l' JupyterLabapplication à l'adresse localhost:8888, accessible dans un navigateur. Assurez-vous que les informations d'identification AWS sont configurées dans votre environnement local avant de continuer.
Utilisation d'Amazon SageMaker AI
Dans la console AWS, accédez à la page de la console Amazon SageMaker AI, puis à la section Carnets de notes sous Applications et IDEs. À partir de là, vous pouvez sélectionner Créer une instance de bloc-notes pour commencer à créer un SageMaker environnement. Sélectionnez un type d'instance et une plate-forme avant de cliquer sur Créer une instance de bloc-notes.
Consultez la documentation de configuration d'Amazon SageMaker AI pour plus d'informations sur les options de configuration et d'instance.
Note
Avertissement : l'utilisation d'Amazon SageMaker AI peut entraîner des frais sur votre compte AWS.
Une fois que l' SageMaker instance est active, vous pouvez l'ouvrir depuis la section Instances du bloc-notes avec Ouvrir JupyterLab. Avant de commencer à utiliser Aurora DSQL dans votre bloc-notes, vous devez fournir un accès à votre cluster DSQL dans le rôle IAM de l' SageMaker instance. La méthode la plus simple consiste à suivre le lien vers le rôle IAM sur la page de l'instance du bloc-notes. À partir de là, vous pouvez modifier les politiques associées à votre rôle SageMaker IAM. Consultez Authentification et autorisation pour plus d'informations sur la configuration d'une politique IAM pour autoriser l'accès à Aurora DSQL.
Connexion à Aurora DSQL à l'aide de JupyterLab
Une fois que vous avez configuré une JupyterLab instance, les étapes pour vous connecter à Aurora DSQL sont les mêmes en local et dans SageMaker AI. Créez un bloc-notes Python 3 vide, dans lequel vous pouvez ajouter des cellules avec du code Python.
Dans une cellule Python, téléchargez le certificat racine Amazon depuis le trust store officiel :
import urllib.request urllib.request.urlretrieve('https://www.amazontrust.com/repository/AmazonRootCA1.pem', 'root.pem')
Pour vous connecter à Aurora DSQL, installez d'abord le connecteur Aurora DSQL pour Python
pip install aurora_dsql_python_connector psycopg
import aurora_dsql_psycopg as dsql
Une fois le connecteur importé, vous pouvez créer une configuration DSQL et vous connecter. Le connecteur Python Aurora DSQL gère automatiquement la création d'un jeton d'authentification à chaque connexion.
config = { 'host': "your-cluster.dsql.us-east-1.on.aws", 'region': "us-east-1", 'user': "admin" } conn = dsql.connect(**config)
Après avoir exécuté votre code, vous devriez maintenant disposer d'une connexion Psycopg à Aurora DSQL. Vous pouvez ensuite exécuter des requêtes à l'aide du curseur Psycopg et en fournissant votre requête SQL. Consultez la documentation de Psycopgresults_list
with conn: with conn.cursor() as cur: cur.execute("SELECT * FROM table") results_list = cur.fetchall()
Vous pouvez ensuite utiliser des frameworks Python tels que Pandas
pip install pandas import pandas as pd df = pd.DataFrame(tuples_list) print(df) print(f"Total records: {len(df)}")
Exemple de carnet
Suggestions de lecture
Documentation de configuration d'Amazon SageMaker AI
Connecteur SQL Aurora pour Python