Consideraciones para crear aplicaciones Apache Kafka de varias regiones Uso de una topología de clúster activo-activo frente a una activo-pasivo

Uso de la replicación para aumentar la resiliencia de una aplicación de streaming de Kafka en las regiones

Puede usar MSK Replicator para configurar topologías de clústeres activo-activo o activo-pasivo a fin de aumentar la resiliencia de su aplicación Apache Kafka en todas las regiones. AWS En una configuración activo-activo, ambos clústeres de MSK prestan servicios activos de lectura y escritura. En una configuración activo-pasivo, solo un clúster de MSK a la vez ofrece datos de streaming de forma activa, mientras que el otro clúster se encuentra en espera.

Consideraciones para crear aplicaciones Apache Kafka de varias regiones

Los consumidores deben poder volver a procesar los mensajes duplicados sin que ello repercuta en las fases posteriores. MSK Replicator replica los datos, lo que puede provocar duplicados en el clúster en espera. at-least-once Al cambiar a la AWS región secundaria, es posible que sus consumidores procesen los mismos datos más de una vez. El Replicador MSK prioriza la copia de datos por encima de los desplazamientos de los consumidores para mejorar el rendimiento. Tras una conmutación por error, el consumidor puede empezar a leer los desplazamientos anteriores, lo que resulta en un procesamiento duplicado.

Los productores y los consumidores también deben tolerar la pérdida de un mínimo de datos. Dado que MSK Replicator replica los datos de forma asíncrona, cuando la AWS región principal comienza a experimentar errores, no hay garantía de que todos los datos se repliquen en la región secundaria. Puede utilizar la latencia de replicación para determinar el número máximo de datos que no se copiaron en la región secundaria.

Uso de una topología de clúster activo-activo frente a una activo-pasivo

Una topología de clústeres activo-activo ofrece un tiempo de recuperación prácticamente nulo y permite que la aplicación de streaming funcione simultáneamente en varias regiones de AWS . Cuando un clúster de una región está dañado, las aplicaciones conectadas al clúster de la otra región siguen procesando los datos.

Las configuraciones activo-pasivo son adecuadas para aplicaciones que solo pueden ejecutarse en una región de AWS a la vez o cuando se necesita un mayor control sobre el orden de procesamiento de los datos. Las configuraciones activo-pasivo requieren más tiempo de recuperación que las activo-activo, ya que debe iniciar toda la configuración activo-pasivo, incluidos los productores y los consumidores, en la región secundaria para reanudar el flujo de datos tras una conmutación por error.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Supervisar la replicación

Creación de un clúster de Kafka activo-pasivo