Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengkonfigurasi integrasi
Saat menyiapkan integrasi nol-ETL, Anda dapat mengonfigurasi berbagai parameter untuk mengontrol bagaimana data disinkronkan antara sumber dan sistem target Anda. Bagian ini menjelaskan opsi konfigurasi kunci yang memengaruhi proses ekstraksi dan pemuatan data.
Pengaturan Snapshot sesuai permintaan
Pengaturan On-Demand Snapshot memungkinkan Anda memilih apakah akan terus menyinkronkan pembaruan sumber data ke target data Anda. Ketika dinonaktifkan (default), integrasi menyediakan sinkronisasi berkelanjutan karena perubahan terjadi dalam sistem sumber. Saat diaktifkan, integrasi melakukan replikasi data satu kali tanpa pembaruan berkelanjutan.
catatan
Pengaturan On-Demand Snapshot tidak dapat dimodifikasi setelah integrasi dibuat. Pilih opsi ini dengan hati-hati berdasarkan persyaratan sinkronisasi data Anda.
RefreshInterval pengaturan
RefreshIntervalParameter menentukan frekuensi di mana perubahan pengambilan data (CDC) menarik atau beban tambahan akan dipicu. Parameter ini memberikan fleksibilitas untuk menyelaraskan laju CDC dengan pola pembaruan data spesifik Anda, pertimbangan beban sistem, dan sasaran pengoptimalan kinerja. Interval penyegaran tidak dapat dimodifikasi setelah integrasi dibuat saat targetnya adalah Redshift. Untuk target lain, interval penyegaran dapat dimodifikasi setelah pembuatan integrasi. Untuk sumber DynamoDB dengan interval penyegaran 24 jam atau lebih, Batch harian berurutan untuk sumber DynamoDB lihat untuk detail tentang pemrosesan batch harian berurutan.
Peningkatan waktu dapat diatur dari 15 menit menjadi 8640 menit (enam hari), memungkinkan Anda untuk menyeimbangkan antara kesegaran data dan pemanfaatan sumber daya sistem. Saat ini, interval penyegaran dapat disesuaikan untuk sumber DynamoDB dan SaaS:
Interval minimum: 15 menit
Interval maksimum: 8640 menit (6 hari)
Nilai default: 15 menit untuk sumber DynamoDB dan 60 menit untuk sumber SaaS
Faktor yang perlu dipertimbangkan saat memilih interval penyegaran:
Volatilitas data: Seberapa sering data sumber Anda berubah
Persyaratan bisnis: Seberapa terkini data analitik Anda
Pertimbangan biaya: Pembaruan yang lebih sering dapat mengakibatkan biaya pemrosesan dan penyimpanan yang lebih tinggi
catatan
RefreshInterval parameter mendefinisikan frekuensi pemicu CDC. Frekuensi penyegaran yang sebenarnya dapat dipengaruhi oleh volume perubahan dalam data sumber Anda dan kapasitas pemrosesan sistem target. Pantau kinerja integrasi Anda dan sesuaikan interval penyegaran sesuai kebutuhan untuk mengoptimalkan kasus penggunaan spesifik Anda.
Untuk memodifikasi interval penyegaran secara terprogram, Anda dapat menggunakan ModifyIntegration API dengan parameter. IntegrationConfig
Batch harian berurutan untuk sumber DynamoDB
Untuk integrasi nol-ETL dengan sumber Amazon DynamoDB, saat Anda mengonfigurasi interval penyegaran 1440 menit (24 jam) atau lebih, integrasi menggunakan pemrosesan batch harian berurutan, bukan operasi ekspor tunggal. Perilaku ini disebabkan oleh batasan jendela ekspor DynamoDB, yang memiliki periode ekspor maksimum 24 jam.
Ketika interval penyegaran melebihi 24 jam, integrasi beroperasi sebagai berikut:
Proses CDC menunggu durasi interval penyegaran penuh (misalnya, 6 hari untuk interval 8640 menit).
Setelah interval penyegaran berlalu, integrasi melakukan beberapa ekspor DynamoDB berurutan, masing-masing mencakup hingga jendela 24 jam.
Pekerjaan CDC memproses setiap batch secara berurutan untuk menangkap semua perubahan yang terjadi selama periode interval penyegaran.
Misalnya, jika Anda menetapkan interval penyegaran 8640 menit (6 hari), integrasi akan menunggu 6 hari dan kemudian mengeksekusi 6 atau 7 ekspor berurutan (ekspor 1 ekor mencakup waktu tambahan yang dihabiskan untuk operasi ekspor) dan pekerjaan CDC untuk menyinkronkan semua perubahan dari periode itu.