Prise en main Exemple de carnet Suggestions de lecture

Éditeurs de requêtes : utilisation JupyterLab avec Aurora DSQL

Ce guide fournit des step-by-step instructions sur la façon de connecter et d'interroger Amazon Aurora DSQL à l' JupyterLab aide de Python. JupyterLab est un environnement informatique interactif populaire qui combine du code, du texte et des visualisations dans un seul document. Il est largement utilisé pour les applications de science des données et de recherche.

Les instructions ci-dessous décrivent les principes de base de l'utilisation d'Aurora DSQL dans le cadre d'une installation locale et dans le JupyterLab cadre de l'utilisation d'Amazon SageMaker AI, un service d'apprentissage automatique entièrement géré qui fournit un environnement hébergé avec une interface utilisateur pour les flux de travail de données.

Prise en main

Exigences

Un cluster SQL Aurora
Informations d'identification AWS configurées (installation locale uniquement)
Python version 3.9 ou supérieure (installation locale uniquement)

Utilisation du local JupyterLab

Pour commencer JupyterLab, les utilisateurs doivent d'abord installer l'application en utilisant le pip de Python :


pip install jupyterlab

JupyterLab peut ensuite être ouvert en courantjupyter lab. Cela ouvrira l' JupyterLabapplication à l'adresse localhost:8888, accessible dans un navigateur. Assurez-vous que les informations d'identification AWS sont configurées dans votre environnement local avant de continuer.

Utilisation d'Amazon SageMaker AI

Dans la console AWS, accédez à la page de la console Amazon SageMaker AI, puis à la section Carnets de notes sous Applications et IDEs. À partir de là, vous pouvez sélectionner Créer une instance de bloc-notes pour commencer à créer un SageMaker environnement. Sélectionnez un type d'instance et une plate-forme avant de cliquer sur Créer une instance de bloc-notes.

Consultez la documentation de configuration d'Amazon SageMaker AI pour plus d'informations sur les options de configuration et d'instance.

Note

Avertissement : l'utilisation d'Amazon SageMaker AI peut entraîner des frais sur votre compte AWS.

Une fois que l' SageMaker instance est active, vous pouvez l'ouvrir depuis la section Instances du bloc-notes avec Ouvrir JupyterLab. Avant de commencer à utiliser Aurora DSQL dans votre bloc-notes, vous devez fournir un accès à votre cluster DSQL dans le rôle IAM de l' SageMaker instance. La méthode la plus simple consiste à suivre le lien vers le rôle IAM sur la page de l'instance du bloc-notes. À partir de là, vous pouvez modifier les politiques associées à votre rôle SageMaker IAM. Consultez Authentification et autorisation pour plus d'informations sur la configuration d'une politique IAM pour autoriser l'accès à Aurora DSQL.

Connexion à Aurora DSQL à l'aide de JupyterLab

Une fois que vous avez configuré une JupyterLab instance, les étapes pour vous connecter à Aurora DSQL sont les mêmes en local et dans SageMaker AI. Créez un bloc-notes Python 3 vide, dans lequel vous pouvez ajouter des cellules avec du code Python.

Dans une cellule Python, téléchargez le certificat racine Amazon depuis le trust store officiel :


import urllib.request
urllib.request.urlretrieve('https://www.amazontrust.com/repository/AmazonRootCA1.pem', 'root.pem')

Pour vous connecter à Aurora DSQL, installez d'abord le connecteur Aurora DSQL pour Python et le pilote Psycopg dans une cellule Python, puis importez-le :


pip install aurora_dsql_python_connector psycopg


import aurora_dsql_psycopg as dsql

Une fois le connecteur importé, vous pouvez créer une configuration DSQL et vous connecter. Le connecteur Python Aurora DSQL gère automatiquement la création d'un jeton d'authentification à chaque connexion.


config = {
    'host': "your-cluster.dsql.us-east-1.on.aws",
    'region': "us-east-1",
    'user': "admin"
    }

conn = dsql.connect(**config)

Après avoir exécuté votre code, vous devriez maintenant disposer d'une connexion Psycopg à Aurora DSQL. Vous pouvez ensuite exécuter des requêtes à l'aide du curseur Psycopg et en fournissant votre requête SQL. Consultez la documentation de Psycopg pour plus d'informations sur l'utilisation de Psycopg avec une base de données compatible avec Postgres. Cette requête donnera lieu à une liste de tuples. results_list


with conn:
    with conn.cursor() as cur:
        cur.execute("SELECT * FROM table")
        results_list = cur.fetchall()

Vous pouvez ensuite utiliser des frameworks Python tels que Pandas pour analyser ou visualiser les résultats de vos requêtes, par exemple :


pip install pandas

import pandas as pd

df = pd.DataFrame(tuples_list)
print(df)
print(f"Total records: {len(df)}")

Exemple de carnet

Un bloc-notes d'exemple utilisant Aurora DSQL est disponible dans le référentiel d'exemples Aurora DSQL.

Suggestions de lecture

Documentation de configuration d'Amazon SageMaker AI

Connecteur SQL Aurora pour Python

Documentation sur les pandas

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Éditeur de requête

Sauvegarde et restauration