Editor di query: utilizzo JupyterLab con Aurora DSQL - Amazon Aurora DSQL

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Editor di query: utilizzo JupyterLab con Aurora DSQL

Questa guida fornisce step-by-step istruzioni su come connettersi e interrogare Amazon Aurora DSQL utilizzando Python. JupyterLab JupyterLab è un popolare ambiente informatico interattivo che combina codice, testo e visualizzazioni in un unico documento. È ampiamente utilizzato per la scienza dei dati e le applicazioni di ricerca.

Le istruzioni seguenti illustreranno le basi dell'utilizzo di Aurora DSQL sia nell'installazione locale che nell'utilizzo di SageMaker Amazon AI, un servizio JupyterLab di machine learning completamente gestito che fornisce un ambiente ospitato con un'interfaccia utente per i flussi di lavoro di dati.

Nozioni di base

Requisiti

  • Un cluster Aurora DSQL

  • Credenziali AWS configurate (solo installazione locale)

  • Python versione 3.9 o successiva (solo installazione locale)

Utilizzo locale JupyterLab

Per iniziare JupyterLab, gli utenti devono prima installare l'applicazione usando il pip di Python:

pip install jupyterlab

JupyterLab può quindi essere aperto eseguendo. jupyter lab Questo aprirà l' JupyterLabapplicazione su localhost:8888, accessibile in un browser. Assicurati di avere le credenziali AWS configurate nel tuo ambiente locale prima di procedere.

Utilizzo di Amazon SageMaker AI

Nella console AWS, vai alla pagina della console Amazon SageMaker AI e quindi alla sezione Notebook in Applicazioni e. IDEs Da lì puoi selezionare Crea un'istanza di notebook per iniziare a creare un ambiente. SageMaker Seleziona un tipo di istanza e una piattaforma prima di fare clic su Crea istanza notebook.

Consulta la documentazione sulla configurazione di Amazon SageMaker AI per ulteriori informazioni sulle opzioni di configurazione e istanza.

Nota

Avviso: l'utilizzo di Amazon SageMaker AI può comportare addebiti sul tuo account AWS.

Una volta che l' SageMaker istanza diventa attiva, puoi aprirla dalla sezione Notebook instances con Apri JupyterLab. Prima di iniziare a utilizzare Aurora DSQL sul notebook, è necessario fornire l'accesso al cluster DSQL nel ruolo IAM dell' SageMaker istanza. Il modo più semplice per farlo è seguire il link al ruolo IAM nella pagina dell'istanza del notebook. Da lì puoi modificare le policy allegate al tuo ruolo SageMaker IAM. Vedi Autenticazione e autorizzazione per ulteriori informazioni sulla configurazione di una policy IAM per consentire l'accesso ad Aurora DSQL.

Connessione ad Aurora DSQL tramite JupyterLab

Dopo aver configurato un' JupyterLab istanza, i passaggi per connettersi ad Aurora DSQL sono gli stessi a livello locale e in AI. SageMaker Crea un taccuino Python 3 vuoto, in cui puoi aggiungere celle con codice Python.

In una cella Python, scarica il certificato root di Amazon dal trust store ufficiale:

import urllib.request urllib.request.urlretrieve('https://www.amazontrust.com/repository/AmazonRootCA1.pem', 'root.pem')

Per connetterti ad Aurora DSQL, installa prima il connettore Aurora DSQL per Python e il driver Psycopg in una cella Python, quindi importalo:

pip install aurora_dsql_python_connector psycopg
import aurora_dsql_psycopg as dsql

Con il connettore importato, puoi quindi creare una configurazione DSQL e connetterti. Il connettore Python Aurora DSQL gestirà automaticamente la creazione di un token di autenticazione su ogni connessione.

config = { 'host': "your-cluster.dsql.us-east-1.on.aws", 'region': "us-east-1", 'user': "admin" } conn = dsql.connect(**config)

Dopo aver eseguito il codice, ora dovresti avere una connessione Psycopg ad Aurora DSQL. È quindi possibile eseguire query utilizzando il cursore Psycopg e fornendo la query SQL. Consulta la documentazione di Psycopg per ulteriori informazioni sull'uso di Psycopg con un database compatibile con Postgres. Questa query risulterà in un elenco di tuple in. results_list

with conn: with conn.cursor() as cur: cur.execute("SELECT * FROM table") results_list = cur.fetchall()

È quindi possibile utilizzare framework Python come Pandas per analizzare o visualizzare i risultati delle query, ad esempio:

pip install pandas import pandas as pd df = pd.DataFrame(tuples_list) print(df) print(f"Total records: {len(df)}")

Notebook di esempio

Un notebook di esempio che utilizza Aurora DSQL è disponibile nell'archivio degli esempi Aurora DSQL.

Approfondimenti

Documentazione sulla configurazione di Amazon SageMaker AI

Connettore Aurora DSQL per Python

Documentazione Pandas