Gunakan replikasi untuk meningkatkan ketahanan aplikasi streaming Kafka di seluruh Wilayah - Amazon Managed Streaming untuk Apache Kafka

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gunakan replikasi untuk meningkatkan ketahanan aplikasi streaming Kafka di seluruh Wilayah

Anda dapat menggunakan MSK Replicator untuk menyiapkan topologi cluster aktif-aktif atau aktif-pasif untuk meningkatkan ketahanan aplikasi Apache Kafka Anda di seluruh Wilayah. AWS Dalam pengaturan aktif-aktif, kedua kluster MSK secara aktif melayani membaca dan menulis. Dalam pengaturan aktif-pasif, hanya satu cluster MSK pada satu waktu yang secara aktif melayani data streaming, sementara cluster lainnya dalam keadaan siaga.

Pertimbangan untuk membangun aplikasi Multi-region Apache Kafka

Konsumen Anda harus dapat memproses ulang pesan duplikat tanpa dampak hilir. MSK Replicator mereplikasi data at-least-once yang dapat menghasilkan duplikat di cluster siaga. Ketika Anda beralih ke AWS Wilayah sekunder, konsumen Anda dapat memproses data yang sama lebih dari satu kali. MSK Replicator memprioritaskan penyalinan data daripada offset konsumen untuk kinerja yang lebih baik. Setelah failover, konsumen dapat mulai membaca dari offset sebelumnya yang menghasilkan pemrosesan duplikat.

Produsen dan konsumen juga harus mentolerir kehilangan data minimal. Karena MSK Replicator mereplikasi data secara asinkron, ketika AWS Region primer mulai mengalami kegagalan, tidak ada jaminan bahwa semua data direplikasi ke Region sekunder. Anda dapat menggunakan latensi replikasi untuk menentukan data maksimum yang tidak disalin ke Wilayah sekunder.

Menggunakan topologi cluster aktif-aktif versus aktif-pasif

Topologi cluster aktif-aktif menawarkan waktu pemulihan mendekati nol dan kemampuan aplikasi streaming Anda untuk beroperasi secara bersamaan di beberapa Wilayah. AWS Ketika sebuah cluster di satu Wilayah terganggu, aplikasi yang terhubung ke cluster di Wilayah lain terus memproses data.

Pengaturan pasif aktif cocok untuk aplikasi yang dapat berjalan hanya di satu AWS Wilayah pada satu waktu, atau ketika Anda membutuhkan kontrol lebih besar atas urutan pemrosesan data. Pengaturan aktif-pasif memerlukan lebih banyak waktu pemulihan daripada pengaturan aktif-aktif, karena Anda harus memulai seluruh pengaturan aktif-pasif Anda, termasuk produsen dan konsumen Anda, di Wilayah sekunder untuk melanjutkan streaming data setelah failover.