Editor Kueri: Menggunakan JupyterLab dengan Aurora DSQL - Amazon Aurora DSQL

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Editor Kueri: Menggunakan JupyterLab dengan Aurora DSQL

Panduan ini memberikan step-by-step petunjuk tentang cara menghubungkan dan menanyakan Amazon Aurora DSQL menggunakan Python. JupyterLab JupyterLab adalah lingkungan komputasi interaktif populer yang menggabungkan kode, teks, dan visualisasi dalam satu dokumen. Ini banyak digunakan untuk ilmu data dan aplikasi penelitian.

Petunjuk di bawah ini akan mencakup dasar-dasar penggunaan Aurora DSQL baik dalam instalasi lokal JupyterLab maupun menggunakan Amazon SageMaker AI, layanan pembelajaran mesin yang dikelola sepenuhnya yang menyediakan lingkungan yang dihosting dengan UI untuk alur kerja data.

Memulai

Persyaratan

  • Kluster Aurora DSQL

  • Kredensi AWS dikonfigurasi (hanya instalasi lokal)

  • Python versi 3.9 atau lebih tinggi (hanya instalasi lokal)

Menggunakan lokal JupyterLab

Untuk memulai JupyterLab, pengguna harus terlebih dahulu menginstal aplikasi menggunakan pip Python:

pip install jupyterlab

JupyterLab kemudian dapat dibuka dengan berlarijupyter lab. Ini akan membuka JupyterLab aplikasi di localhost:8888, dapat diakses di browser. Pastikan Anda memiliki kredensi AWS yang dikonfigurasi di lingkungan lokal Anda sebelum melanjutkan.

Menggunakan Amazon SageMaker AI

Di konsol AWS, lanjutkan ke halaman konsol Amazon SageMaker AI dan kemudian ke bagian Notebook di bawah Aplikasi dan IDEs. Dari sana Anda dapat memilih Buat instance notebook untuk mulai membuat SageMaker lingkungan. Pilih jenis dan platform instance sebelum mengklik Buat instance notebook.

Lihat dokumentasi penyiapan Amazon SageMaker AI untuk informasi selengkapnya tentang opsi penyiapan dan instans.

catatan

Peringatan: Menggunakan Amazon SageMaker AI dapat mengakibatkan biaya ke akun AWS Anda.

Setelah SageMaker instans menjadi aktif, Anda dapat membukanya dari bagian instance Notebook dengan Buka JupyterLab. Sebelum memulai dengan Aurora DSQL di notebook Anda, Anda harus menyediakan akses ke cluster DSQL Anda dalam peran IAM instans. SageMaker Cara termudah untuk melakukannya adalah dengan mengikuti tautan ke peran IAM di halaman instance notebook. Dari sana Anda dapat mengedit Kebijakan yang dilampirkan ke peran SageMaker IAM Anda. Lihat Otentikasi dan otorisasi untuk informasi selengkapnya tentang mengonfigurasi kebijakan IAM untuk mengizinkan akses ke Aurora DSQL.

Menghubungkan ke Aurora DSQL menggunakan JupyterLab

Setelah Anda menyiapkan JupyterLab instance, langkah-langkah untuk terhubung ke Aurora DSQL sama secara lokal dan di AI. SageMaker Buat notebook Python 3 kosong, di mana Anda dapat menambahkan sel dengan kode Python.

Di sel Python, unduh sertifikat root Amazon dari toko kepercayaan resmi:

import urllib.request urllib.request.urlretrieve('https://www.amazontrust.com/repository/AmazonRootCA1.pem', 'root.pem')

Untuk terhubung ke Aurora DSQL, pertama-tama instal Konektor Aurora DSQL untuk Python dan driver Psycopg di sel Python, lalu impor:

pip install aurora_dsql_python_connector psycopg
import aurora_dsql_psycopg as dsql

Dengan konektor yang diimpor, Anda kemudian dapat membuat konfigurasi DSQL dan terhubung. Konektor Python Aurora DSQL akan secara otomatis menangani pembuatan token otentikasi pada setiap koneksi.

config = { 'host': "your-cluster.dsql.us-east-1.on.aws", 'region': "us-east-1", 'user': "admin" } conn = dsql.connect(**config)

Setelah menjalankan kode Anda, Anda sekarang harus memiliki koneksi Psycopg ke Aurora DSQL. Anda kemudian dapat menjalankan kueri menggunakan kursor Psycopg dan memberikan kueri SQL Anda. Lihat dokumentasi Psycopg untuk informasi lebih lanjut tentang penggunaan Psycopg dengan database yang kompatibel dengan Postgres. Kueri ini akan menghasilkan daftar tupel di. results_list

with conn: with conn.cursor() as cur: cur.execute("SELECT * FROM table") results_list = cur.fetchall()

Anda kemudian dapat menggunakan kerangka kerja Python seperti Pandas untuk menganalisis atau memvisualisasikan hasil kueri Anda, misalnya:

pip install pandas import pandas as pd df = pd.DataFrame(tuples_list) print(df) print(f"Total records: {len(df)}")

Contoh buku catatan

Contoh notebook menggunakan Aurora DSQL tersedia di repositori sampel Aurora DSQL.

Sumber bacaan lebih lanjut

Dokumentasi penyiapan Amazon SageMaker AI

Konektor Aurora DSQL untuk Python

Dokumentasi panda