Menambahkan data ke Aurora DB cluster dan menanyakannya - Amazon Aurora

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menambahkan data ke Aurora DB cluster dan menanyakannya

Untuk menyelesaikan pembuatan integrasi nol-ETL yang mereplikasi data dari Amazon Aurora ke Amazon Redshift, Anda harus membuat database di tujuan target.

Untuk koneksi dengan Amazon Redshift, sambungkan ke klaster atau grup kerja Amazon Redshift Anda dan buat database dengan referensi ke pengenal integrasi Anda. Kemudian, Anda dapat menambahkan data ke sumber Anda Aurora DB cluster dan melihatnya direplikasi di Amazon Redshift atau. Amazon SageMaker

Membuat database target

Sebelum Anda dapat mulai mereplikasi data ke Amazon Redshift, setelah Anda membuat integrasi, Anda harus membuat database di gudang data target Anda. Database ini harus menyertakan referensi ke identifier integrasi. Anda dapat menggunakan konsol Amazon Redshift atau Editor kueri v2 untuk membuat basis data.

Untuk petunjuk cara membuat basis data tujuan, lihat Membuat basis data tujuan di Amazon Redshift.

Menambahkan data ke sumber DB cluster

Setelah Anda mengkonfigurasi integrasi Anda, Anda dapat menambahkan beberapa data ke Aurora DB cluster yang ingin Anda replikasi ke gudang data Anda.

catatan

Ada perbedaan antara tipe data di Aurora dan gudang analitik target. Untuk tabel pemetaan jenis data, lihat Perbedaan jenis data antara basis data Aurora dan Amazon Redshift.

Pertama, sambungkan ke cluster DB sumber menggunakan klien MySQL atau PostgreSQL pilihan Anda. Untuk petunjuk, lihat Menghubungkan ke klaster DB Amazon Aurora.

Kemudian, buat tabel dan masukkan urutan data sampel.

penting

Pastikan tabel memiliki kunci primer. Jika tidak, tabel tidak dapat direplikasi ke gudang data target.

Utilitas pg_dump dan pg_restore PostgreSQL awalnya membuat tabel tanpa kunci utama dan kemudian menambahkannya setelahnya. Jika Anda menggunakan salah satu utilitas ini, sebaiknya buat skema terlebih dahulu, lalu muat data dalam perintah terpisah.

MySQL

Contoh berikut menggunakan utilitas MySQL Workbench.

CREATE DATABASE my_db; USE my_db; CREATE TABLE books_table (ID int NOT NULL, Title VARCHAR(50) NOT NULL, Author VARCHAR(50) NOT NULL, Copyright INT NOT NULL, Genre VARCHAR(50) NOT NULL, PRIMARY KEY (ID)); INSERT INTO books_table VALUES (1, 'The Shining', 'Stephen King', 1977, 'Supernatural fiction');

PostgreSQL

Contoh berikut menggunakan terminal interaktif PostgreSQL psql. Saat menghubungkan ke klaster, sertakan basis data bernama yang Anda tentukan saat membuat integrasi.

psql -h mycluster.cluster-123456789012.us-east-2.rds.amazonaws.com -p 5432 -U username -d named_db; named_db=> CREATE TABLE books_table (ID int NOT NULL, Title VARCHAR(50) NOT NULL, Author VARCHAR(50) NOT NULL, Copyright INT NOT NULL, Genre VARCHAR(50) NOT NULL, PRIMARY KEY (ID)); named_db=> INSERT INTO books_table VALUES (1, 'The Shining', 'Stephen King', 1977, 'Supernatural fiction');

Menanyakan data Anda di Amazon Redshift

Setelah Anda menambahkan data ke Aurora DB cluster, itu direplikasi ke database tujuan dan siap untuk ditanyakan.

Untuk mengueri data yang direplikasi
  1. Buka konsol Amazon Redshift dan pilih Editor kueri v2 dari panel navigasi kiri.

  2. Hubungkan ke klaster atau grup kerja Anda dan pilih basis data tujuan Anda (yang Anda buat dari integrasi) dari menu dropdown (destination_database dalam contoh ini). Untuk petunjuk cara membuat basis data tujuan, lihat Membuat basis data tujuan di Amazon Redshift.

  3. Gunakan pernyataan SELECT untuk menanyakan data Anda. Dalam contoh ini, Anda dapat menjalankan perintah berikut untuk memilih semua data dari tabel yang Anda buat di sumber Aurora DB cluster:

    SELECT * from my_db."books_table";
    Jalankan pernyataan SELECT dalam editor kueri. Hasilnya adalah satu baris data sampel yang ditambahkan ke database Amazon RDS.
    • my_db adalah nama skema basis data Aurora. Opsi ini hanya diperlukan untuk basis data MySQL.

    • books_table adalah nama tabel Aurora.

Anda juga dapat menanyakan data menggunakan klien baris perintah. Misalnya:

destination_database=# select * from my_db."books_table"; ID | Title | Author | Copyright | Genre | txn_seq | txn_id ----+–------------+---------------+-------------+------------------------+----------+--------+ 1 | The Shining | Stephen King | 1977 | Supernatural fiction | 2 | 12192
catatan

Untuk kepekaan huruf besar/kecil, gunakan tanda kutip ganda (" ") untuk nama skema, tabel, dan kolom. Untuk informasi selengkapnya, lihat enable_case_sensitive_identifier.

Perbedaan jenis data antara basis data Aurora dan Amazon Redshift

atau Aurora PostgreSQL ke tipe data tujuan yang sesuai. Amazon Aurora saat ini hanya mendukung jenis data ini untuk integrasi nol-ETL.

Jika tabel di cluster DB sumber Anda menyertakan tipe data yang tidak didukung, tabel tidak sinkron dan tidak dapat dikonsumsi oleh target tujuan. Streaming dari sumber ke target berlanjut, tetapi tabel dengan jenis data yang tidak didukung tidak tersedia. Untuk memperbaiki tabel dan membuatnya tersedia di tujuan target, Anda harus secara manual mengembalikan perubahan yang melanggar dan kemudian menyegarkan integrasi dengan menjalankanALTER DATABASE...INTEGRATION REFRESH.

catatan

Anda tidak dapat menyegarkan integrasi nol-ETL dengan lakehouse. Amazon SageMaker Sebagai gantinya, hapus dan coba buat integrasi lagi.

Aurora MySQL

Jenis data Aurora MySQL Tipe data target Deskripsi Batasan
INT INTEGER Bilangan bulat empat byte bertanda Tidak ada
SMALLINT SMALLINT Bilangan bulat dua byte bertanda Tidak ada
TINYINT SMALLINT Bilangan bulat dua byte bertanda Tidak ada
MEDIUMINT INTEGER Bilangan bulat empat byte bertanda Tidak ada
BIGINT BIGINT Bilangan bulat delapan byte bertanda Tidak ada
INT UNSIGNED BIGINT Bilangan bulat delapan byte bertanda Tidak ada
TINYINT UNSIGNED SMALLINT Bilangan bulat dua byte bertanda Tidak ada
MEDIUMINT UNSIGNED INTEGER Bilangan bulat empat byte bertanda Tidak ada
BIGINT UNSIGNED DECIMAL(20,0) Numerik persis dari presisi yang dapat dipilih Tidak ada
DECIMAL(p,s) = NUMERIC(p,s) DECIMAL(p,s) Numerik persis dari presisi yang dapat dipilih

Presisi lebih besar dari 38 dan penskalaan lebih besar dari 37 tidak didukung

DECIMAL(p,s) UNSIGNED = NUMERIC(p,s) UNSIGNED DECIMAL(p,s) Numerik persis dari presisi yang dapat dipilih

Presisi lebih besar dari 38 dan penskalaan lebih besar dari 37 tidak didukung

FLOAT4/NYATA REAL Angka floating-point presisi tunggal Tidak ada
FLOAT4/NYATA TIDAK DITANDATANGANI REAL Angka floating-point presisi tunggal Tidak ada
DOUBLE/REAL/FLOAT8 DOUBLE PRECISION Angka floating-point presisi ganda Tidak ada
DOUBLE/REAL/FLOAT8 TIDAK DITANDATANGANI DOUBLE PRECISION Angka floating-point presisi ganda Tidak ada
BIT(n) VARBYTE(8) Nilai biner dengan panjang variabel Tidak ada
BINER (n) VARBYTE(n) Nilai biner dengan panjang variabel Tidak ada
VARBINER (n) VARBYTE(n) Nilai biner dengan panjang variabel Tidak ada
CHAR(n) VARCHAR(n) Nilai string dengan panjang variabel Tidak ada
VARCHAR(n) VARCHAR(n) Nilai string dengan panjang variabel Tidak ada
TEXT VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
TINYTEXT VARCHAR(255) Nilai string panjang variabel hingga 255 karakter Tidak ada
MEDIUMTEXT VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
LONGTEXT VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
ENUM VARCHAR(1020) Nilai string panjang variabel hingga 1.020 karakter Tidak ada
SET VARCHAR(1020) Nilai string panjang variabel hingga 1.020 karakter Tidak ada
DATE DATE Tanggal kalender (tahun, bulan, hari) Tidak ada
DATETIME TIMESTAMP Tanggal dan waktu (tanpa zona waktu) Tidak ada
TIMESTAMP(p) TIMESTAMP Tanggal dan waktu (tanpa zona waktu) Tidak ada
TIME VARCHAR(18) Nilai string panjang variabel hingga 18 karakter Tidak ada
YEAR VARCHAR(4) Nilai string panjang variabel hingga 4 karakter Tidak ada
JSON SUPER Data atau dokumen semi-terstruktur sebagai nilai Tidak ada

Aurora PostgreSQL

Integrasi nol-ETL untuk Aurora PostgreSQL tidak mendukung jenis data kustom atau jenis data yang dibuat oleh ekstensi.

Jenis data Aurora PostgreSQL Jenis data Amazon Redshift Deskripsi Batasan
array SUPER Data atau dokumen semi-terstruktur sebagai nilai Tidak ada
bigint BIGINT Bilangan bulat delapan byte bertanda Tidak ada
bigserial BIGINT Bilangan bulat delapan byte bertanda Tidak ada
bit varying(n) VARBYTE(n) Nilai biner panjang variabel hingga 16.777.216 byte Tidak ada
bit(n) VARBYTE(n) Nilai biner panjang variabel hingga 16.777.216 byte Tidak ada
sedikit, sedikit bervariasi VARBYTE (16777216) Nilai biner panjang variabel hingga 16.777.216 byte Tidak ada
boolean BOOLEAN Boolean logis (true/false) Tidak ada
bytea VARBYTE (16777216) Nilai biner panjang variabel hingga 16.777.216 byte Tidak ada
arang (n) CHAR(n) Nilai string karakter dengan panjang tetap hingga 65.535 byte Tidak ada
char bervariasi (n) VARCHAR(65535) Nilai string karakter panjang variabel hingga 65.535 karakter Tidak ada
cid BIGINT

Bilangan bulat delapan byte bertanda

Tidak ada
cidr

VARCHAR(19)

Nilai string panjang variabel hingga 19 karakter

Tidak ada
date DATE Tanggal kalender (tahun, bulan, hari)

Nilai lebih besar dari 294.276 A.D. tidak didukung

double precision DOUBLE PRECISION Angka floating-point presisi ganda Nilai subnormal tidak sepenuhnya didukung

gtsvektor

VARCHAR(65535)

Nilai string panjang variabel hingga 65.535 karakter

Tidak ada
inet

VARCHAR(19)

Nilai string panjang variabel hingga 19 karakter

Tidak ada
integer INTEGER Bilangan bulat empat byte bertanda Tidak ada

int2vektor

SUPER Data atau dokumen semi-terstruktur sebagai nilai. Tidak ada
interval INTERVAL Durasi waktu Hanya jenis INTERVAL yang menentukan tahun ke bulan atau hari ke kualifikasi kedua yang didukung.
json SUPER Data atau dokumen semi-terstruktur sebagai nilai Tidak ada
jsonb SUPER Data atau dokumen semi-terstruktur sebagai nilai Tidak ada
jsonpath VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada

macaddr

VARCHAR (17) Nilai string panjang variabel hingga 17 karakter Tidak ada

macaddr8

VARCHAR (23) Nilai string panjang variabel hingga 23 karakter Tidak ada
money DECIMAL(20,3) Jumlah mata uang Tidak ada
name VARCHAR (64) Nilai string panjang variabel hingga 64 karakter Tidak ada
numeric(p,s) DECIMAL(p,s) Nilai presisi tetap yang ditentukan pengguna
  • Nilai NaN tidak didukung

  • Presisi dan skala harus didefinisikan secara eksplisit dan tidak lebih besar dari 38 (presisi) dan 37 (skala)

  • Skala negatif tidak didukung

oid BIGINT Bilangan bulat delapan byte bertanda Tidak ada
oidvektor SUPER Data atau dokumen semi-terstruktur sebagai nilai. Tidak ada
pg_brin_bloom_summary VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
pg_dependencies VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
pg_lsn VARCHAR (17) Nilai string panjang variabel hingga 17 karakter Tidak ada
pg_mcv_list VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
pg_ndistinct VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
pg_node_pohon VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
pg_snapshot VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
real REAL Angka floating-point presisi tunggal Nilai subnormal tidak sepenuhnya didukung
refkursor VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
smallint SMALLINT Bilangan bulat dua byte bertanda Tidak ada
smallserial SMALLINT Bilangan bulat dua byte bertanda Tidak ada
serial INTEGER Bilangan bulat empat byte bertanda Tidak ada
text VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
masa VARCHAR (23) Nilai string panjang variabel hingga 23 karakter Tidak ada
waktu [(p)] tanpa zona waktu VARCHAR(19) Nilai string panjang variabel hingga 19 karakter Nilai Infinity dan -Infinity tidak didukung
time [(p)] with time zone VARCHAR(22) Nilai string panjang variabel hingga 22 karakter Nilai Infinity dan -Infinity tidak didukung
stempel waktu [(p)] tanpa zona waktu TIMESTAMP Tanggal dan waktu (tanpa zona waktu)
  • Nilai Infinity dan -Infinity tidak didukung

  • Nilai yang lebih besar dari 9999-12-31 tidak didukung

  • Nilai B.C. tidak didukung

timestamp [(p)] with time zone TIMESTAMPTZ Tanggal dan waktu (dengan zona waktu)
  • Nilai Infinity dan -Infinity tidak didukung

  • Nilai yang lebih besar dari 9999-12-31 tidak didukung

  • Nilai B.C. tidak didukung

tsquery VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
tsvektor VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
txid_snapshot VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada
uuid VARCHAR (36) Variabel-panjang 36 string karakter Tidak ada
xid BIGINT Bilangan bulat delapan byte bertanda Tidak ada
xid8 DESIMAL (20, 0) Desimal presisi tetap Tidak ada
xml VARCHAR(65535) Nilai string panjang variabel hingga 65.535 karakter Tidak ada

Operasi DDL untuk Aurora PostgreSQL

Amazon Redshift berasal dari PostgreSQL, sehingga berbagi beberapa fitur dengan Aurora PostgreSQL karena arsitektur PostgreSQL yang umum. Integrasi nol-ETL memanfaatkan kesamaan ini untuk merampingkan replikasi data dari Aurora PostgreSQL ke Amazon Redshift, memetakan database berdasarkan nama dan memanfaatkan database, skema, dan struktur tabel bersama.

Pertimbangkan poin-poin berikut saat mengelola integrasi Aurora PostgreSQL Zero-ETL:

  • Isolasi dikelola di tingkat database.

  • Replikasi terjadi pada tingkat database.

  • Database Aurora PostgreSQL dipetakan ke database Amazon Redshift berdasarkan nama, dengan data mengalir ke database Redshift berganti nama yang sesuai jika aslinya diganti namanya.

Terlepas dari kesamaan mereka, Amazon Redshift dan Aurora PostgreSQL memiliki perbedaan penting. Bagian berikut menguraikan respons sistem Amazon Redshift untuk operasi DDL umum.

Operasi basis data

Tabel berikut menunjukkan respon sistem untuk operasi DDL database.

Operasi DDL Respon sistem Redshift
CREATE DATABASE Tidak ada operasi
DROP DATABASE Amazon Redshift menghapus semua data dalam database Redshift target.
RENAME DATABASE Amazon Redshift menghapus semua data dalam database target asli dan menyinkronkan ulang data dalam database target baru. Jika database baru tidak ada, Anda harus membuatnya secara manual. Untuk petunjuknya, lihat Membuat database tujuan di Amazon Redshift.

Operasi skema

Tabel berikut menunjukkan respon sistem untuk operasi skema DDL.

Operasi DDL Respon sistem Redshift
CREATE SCHEMA Tidak ada operasi
DROP SCHEMA Amazon Redshift menjatuhkan skema asli.
RENAME SCHEMA Amazon Redshift menghapus skema asli lalu menyinkronkan ulang data dalam skema baru.

Operasi tabel

Tabel berikut menunjukkan respon sistem untuk operasi tabel DDL.

Operasi DDL Respon sistem Redshift
CREATE TABLE

Amazon Redshift membuat tabel.

Beberapa operasi menyebabkan pembuatan tabel gagal, seperti membuat tabel tanpa kunci utama atau melakukan partisi deklaratif. Untuk informasi selengkapnya, lihat Keterbatasan Aurora PostgreSQL dan Memecahkan masalah integrasi .

DROP TABLE Amazon Redshift menjatuhkan meja.
TRUNCATE TABLE Amazon Redshift memotong tabel.
ALTER TABLE (RENAME...) Amazon Redshift mengganti nama tabel atau kolom.
ALTER TABLE (SET SCHEMA)

Amazon Redshift menjatuhkan tabel dalam skema asli dan menyinkronkan ulang tabel dalam skema baru.

ALTER TABLE (ADD PRIMARY KEY) Amazon Redshift menambahkan kunci utama dan menyinkronkan ulang tabel.
ALTER TABLE (ADD COLUMN) Amazon Redshift menambahkan kolom ke tabel.
ALTER TABLE (DROP COLUMN)

Amazon Redshift menjatuhkan kolom jika bukan kolom kunci utama. Jika tidak, itu menyinkronkan ulang tabel.

ALTER TABLE (SET LOGGED/UNLOGGED) Jika Anda mengubah tabel menjadi login, Amazon Redshift akan menyinkronkan ulang tabel. Jika Anda mengubah tabel menjadi tidak tercatat, Amazon Redshift akan menjatuhkan tabel.