Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Integrasi Amazon RDS
Extract, transform, and load (ETL) adalah proses menggabungkan data dari berbagai sumber menjadi gudang data sentral yang besar.
Integrasi nol-ETL membuat data dalam basis data RDS Anda Kluster Aurora waktu dekat. Amazon SageMaker AI Setelah data tersebut berada di gudang data target atau data lake, Anda dapat memberi daya pada beban kerja analitik, ML, dan AI Anda menggunakan kemampuan bawaan, seperti pembelajaran mesin, tampilan terwujud, berbagi data, akses gabungan ke beberapa penyimpanan data dan data lake, dan integrasi dengan SageMaker Amazon AI, QuickSight, dan lainnya. Layanan AWS
Untuk membuat integrasi nol-ETL, Anda menentukan database RDS Aurora sebagai sumber, dan gudang data atau lakehouse yang didukung sebagai target. Integrasi mereplikasi data dari database sumber ke gudang data target atau lakehouse.
Diagram berikut menggambarkan fungsi ini untuk integrasi nol-ETL dengan Amazon Redshift:

Diagram berikut menggambarkan fungsi ini untuk integrasi nol-ETL dengan rumah danau: Amazon SageMaker AI

Integrasi memantau kondisi pipeline data dan memulihkan dari masalah jika memungkinkan. Anda dapat membuat integrasi dari beberapa basis data RDS cluster ke dalam satu gudang data target tunggal atau lakehouse yang memungkinkan Anda memperoleh wawasan di beberapa aplikasi.
Topik
Manfaat
Integrasi RDS Zero-ETL memiliki manfaat sebagai berikut:
-
Membantu Anda memperoleh wawasan menyeluruh dari berbagai sumber data.
-
Menghilangkan kebutuhan untuk membangun dan memelihara pipeline data yang kompleks yang melakukan operasi extract, transform, and load (ETL). Integrasi nol-ETL menghilangkan tantangan yang muncul dalam membangun dan mengelola pipeline dengan menyediakan dan mengelolanya untuk Anda.
-
Mengurangi beban dan biaya operasional, serta membantu Anda fokus pada peningkatan aplikasi Anda.
-
Memungkinkan Anda memanfaatkan analitik tujuan target dan kemampuan ML untuk memperoleh wawasan dari data transaksional dan lainnya, untuk merespons secara efektif peristiwa kritis dan sensitif terhadap waktu.
Konsep utama
Saat mulai menggunakan integrasi nol-ETL, pertimbangkan konsep berikut ini:
- Integrasi
-
Pipa data yang dikelola sepenuhnya yang secara otomatis mereplikasi data dan skema transaksional dari database RDS Aurora ke gudang data atau katalog.
- Database sumber
-
Basis data RDS cluster tempat data direplikasi. Anda dapat menentukan instans DB Single-AZ atau Multi-AZ, atau cluster DB multi-AZ.
- Target
-
Gudang data atau lakehouse tempat data direplikasi. Ada dua jenis gudang data: gudang data klaster terprovisi dan gudang data nirserver. Gudang data klaster terprovisi adalah kumpulan sumber daya komputasi yang disebut simpul, yang diatur ke dalam grup yang disebut klaster. Gudang data nirserver terdiri dari grup kerja yang menyimpan sumber daya komputasi, serta ruang nama yang menampung objek basis data dan pengguna. Kedua gudang data menjalankan mesin analitik dan berisi satu atau lebih database.
Target lakehouse terdiri dari katalog, database, tabel, dan tampilan. Untuk informasi lebih lanjut tentang arsitektur lakehouse, lihat SageMaker Lakehouse componentsdi Amazon SageMaker AI Unified StudioPanduan Pengguna.
Beberapa basis data sumber dapat menulis ke target yang sama.
Untuk informasi selengkapnya, lihat Arsitektur sistem gudang data dalam Panduan Developer Amazon Redshift.
Batasan
Keterbatasan berikut berlaku untuk integrasi RDS .
Topik
Batasan umum
-
basis data sumber harus berada di Wilayah yang sama dengan target.
-
Anda tidak dapat mengganti nama jika memiliki integrasi yang ada.
-
Anda tidak dapat membuat beberapa integrasi antara database sumber dan target yang sama.
-
Anda tidak dapat menghapus database yang memiliki integrasi yang ada. Anda harus menghapus semua integrasi yang terkait terlebih dahulu.
-
Jika Anda menghentikan basis data sumber, beberapa transaksi terakhir mungkin tidak direplikasi ke target sampai Anda melanjutkan database.
-
Anda tidak dapat menghapus integrasi jika database sumber dihentikan.
-
Jika database Anda adalah sumber penerapan biru/hijau, lingkungan biru dan hijau tidak dapat memiliki integrasi nol-ETL selama peralihan. Anda harus menghapus integrasi tersebut terlebih dahulu dan beralih, lalu membuat ulang integrasi.
-
Anda tidak dapat membuat integrasi untuk database sumber yang memiliki integrasi lain yang sedang dibuat secara aktif.
-
Saat Anda pertama kali membuat integrasi, atau ketika tabel sedang disinkronkan ulang, seeding data dari sumber ke target dapat memakan waktu 20-25 menit atau lebih tergantung ukuran basis data sumber. Penundaan ini dapat menyebabkan peningkatan lag replika.
-
Beberapa jenis data tidak didukung. Untuk informasi selengkapnya, lihat Perbedaan jenis data antara basis data RDS dan Amazon Redshift.
-
Tabel sistem, tabel sementara, dan tampilan tidak direplikasi ke gudang target.
-
Melakukan perintah DDL (misalnya
ALTER TABLE
) pada tabel sumber dapat memicu sinkronisasi ulang tabel, membuat tabel tidak tersedia untuk kueri saat disinkronkan ulang. Untuk informasi selengkapnya, lihat Satu atau beberapa tabel Amazon Redshift saya memerlukan sinkronisasi ulang.
Batasan RDS for MySQL
-
Database sumber Anda harus menjalankan versi RDS yang didukung untuk MySQL. Untuk daftar versi yang didukung, lihat Daerah yang Didukung dan engine DB untuk integrasi Amazon RDS Zero-ETL.
-
Integrasi nol-ETL tidak didukung pada instance utama dan instance replika baca di Wilayah yang sama. AWS
-
Integrasi nol-ETL mengandalkan pencatatan log biner MySQL (binlog) untuk mengambil perubahan data yang sedang berlangsung. Jangan gunakan pemfilteran data berbasis binlog, karena dapat menyebabkan inkonsistensi data antara basis data sumber dan target.
-
Integrasi nol-ETL didukung hanya untuk basis data yang dikonfigurasi untuk menggunakan mesin penyimpanan InnoDB.
-
Referensi kunci asing dengan pembaruan tabel yang telah ditentukan sebelumnya tidak didukung. Secara khusus,
ON DELETE
danON UPDATE
aturan tidak didukung denganCASCADE
,SET NULL
, danSET DEFAULT
tindakan. Mencoba membuat atau memperbarui tabel dengan referensi tersebut ke tabel lain akan menempatkan tabel ke dalam keadaan gagal.
RDS untuk keterbatasan PostgreSQL
-
Database sumber harus berupa RDS untuk instance PostgreSQL yang menjalankan versi 15.7+, 16.3+, atau 17.1+. Versi sebelumnya tidak didukung.
-
Anda tidak dapat membuat integrasi nol-ETL dari RDS untuk instance replika baca PostgreSQL.
-
Tabel PostgreSQL yang tidak tercatat dan tampilan terwujud tidak direplikasi ke Amazon Redshift.
-
Replikasi tipe data PostgreSQL tertentu, seperti tipe data geometri
dan data yang lebih besar dari 64KB, tidak didukung karena keterbatasan di Amazon Redshift. Untuk informasi selengkapnya tentang perbedaan tipe data antara RDS untuk PostgreSQL dan Amazon Redshift, lihat di bagian Perbedaan tipe data. -
Anda tidak dapat melakukan pemutakhiran versi utama pada RDS sumber untuk instance PostgreSQL saat memiliki integrasi nol-ETL aktif. Untuk memutakhirkan instance sumber, Anda harus terlebih dahulu menghapus semua integrasi nol-ETL yang ada. Setelah upgrade versi utama selesai, Anda dapat membuat ulang integrasi nol-ETL.
-
Jika Anda melakukan transaksi partisi deklaratif
pada instans DB sumber, semua tabel yang terpengaruh memasukkan status gagal dan tidak lagi dapat diakses.
Batasan RDS for Oracle
-
Database sumber harus berupa RDS untuk instance Oracle yang menjalankan versi 19c Enterprise Edition atau Edisi Standar 2, Pembaruan Rilis Juli 2019 atau yang lebih baru. Versi sebelumnya tidak didukung.
-
Anda tidak dapat membuat integrasi nol-ETL dari RDS untuk instance replika baca Oracle.
-
Anda tidak dapat mengganti nama database penyewa ketika ada integrasi nol-ETL pada database penyewa itu.
-
Database penyewa hanya dapat memiliki satu integrasi nol-ETL.
-
Saat Anda membuat integrasi nol-ETL dari RDS untuk Oracle, Anda tidak dapat memodifikasi integrasi itu. Untuk memodifikasi integrasi, Anda harus menghapus integrasi dan kemudian membuat yang baru.
-
RDS untuk Oracle dan Amazon Redshift memiliki beberapa perbedaan tipe data. Untuk informasi selengkapnya, lihat RDS for Oracle di bagian Perbedaan tipe data.
Batasan Amazon Redshift
Untuk daftar batasan Amazon Redshift yang terkait dengan integrasi Nol-ETL, lihat Pertimbangan saat menggunakan integrasi Nol-ETL dengan Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.
Amazon SageMaker AI keterbatasan lakehouse
Berikut ini adalah batasan untuk integrasi Amazon SageMaker AI lakehouse zero-ETL.
-
Nama katalog dibatasi hingga 19 karakter panjangnya.
Kuota
Akun Anda memiliki kuota berikut yang terkait dengan integrasi RDS Zero-ETL. Kecuali ditentukan lain, masing-masing kuota ditentukan untuk setiap Wilayah.
Nama | Default | Deskripsi |
---|---|---|
Integrasi | 100 | Jumlah total integrasi dalam sebuah Akun AWS. |
Integrasi per target | 50 | Jumlah integrasi yang mengirimkan data ke gudang data target tunggal atau lakehouse. |
Integrasi per instans sumber | 5 | Jumlah integrasi yang mengirimkan data dari instans DB sumber tunggal. |
Selain itu, gudang target menempatkan batasan tertentu pada jumlah tabel yang diizinkan di setiap instance DB atau node cluster. Untuk informasi selengkapnya tentang kuota dan batas Amazon Redshift, lihat Kuota dan batas di Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.
Wilayah yang Didukung
Integrasi RDS Zero-ETL tersedia dalam subset. Wilayah AWS Untuk mengetahui daftar Wilayah yang didukung, lihat Daerah yang Didukung dan engine DB untuk integrasi Amazon RDS Zero-ETL.