Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Uso de la replicación para aumentar la resiliencia de una aplicación de streaming de Kafka en las regiones
Puede usar el Replicador MSK para configurar topologías de clústeres activo-activo o activo-pasivo a fin de aumentar la resistencia de la aplicación Apache Kafka en las regiones de. AWS En una configuración activo-activo, ambos clústeres de MSK prestan servicios activos de lectura y escritura. En una configuración activo-pasivo, solo un clúster de MSK a la vez ofrece datos de streaming de forma activa, mientras que el otro clúster se encuentra en espera.
Consideraciones para crear aplicaciones Apache Kafka de varias regiones
Los consumidores deben poder volver a procesar los mensajes duplicados sin que ello repercuta en las fases posteriores. El Replicador MSK replica los datos, at-least-once lo que puede provocar duplicados en el clúster en espera. Al cambiar a la AWS región secundaria de, es posible que los consumidores procesen los mismos datos más de una vez. El Replicador MSK prioriza la copia de datos por encima de los desplazamientos de los consumidores para mejorar el rendimiento. Tras una conmutación por error, el consumidor puede empezar a leer los desplazamientos anteriores, lo que resulta en un procesamiento duplicado.
Los productores y los consumidores también deben tolerar la pérdida de un mínimo de datos. Dado que el Replicador MSK replica los datos de forma asíncrona, cuando la AWS región principal de comienza a sufrir errores, no hay garantía de que todos los datos se repliquen en la región secundaria. Puede utilizar la latencia de replicación para determinar el número máximo de datos que no se copiaron en la región secundaria.
Uso de una topología de clúster activo-activo frente a una activo-pasivo
Una topología de clústeres activo-activo ofrece un tiempo de recuperación prácticamente nulo y permite que la aplicación de streaming funcione simultáneamente en varias regiones de AWS . Cuando un clúster de una región está dañado, las aplicaciones conectadas al clúster de la otra región siguen procesando los datos.
Las configuraciones activo-pasivo son adecuadas para aplicaciones que solo pueden ejecutarse en una región de AWS a la vez o cuando se necesita un mayor control sobre el orden de procesamiento de los datos. Las configuraciones activo-pasivo requieren más tiempo de recuperación que las activo-activo, ya que debe iniciar toda la configuración activo-pasivo, incluidos los productores y los consumidores, en la región secundaria para reanudar el flujo de datos tras una conmutación por error.