Utilisation de la réplication pour augmenter la résilience d'une application de streaming Kafka dans toutes les régions - Amazon Managed Streaming for Apache Kafka

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de la réplication pour augmenter la résilience d'une application de streaming Kafka dans toutes les régions

Vous pouvez utiliser le réplicateur MSK pour configurer des topologies de cluster actif-actif ou actif-passif afin d'accroître la résilience de votre application Apache Kafka dans toutes les régions. AWS Dans une configuration active-active, les deux clusters MSK effectuent activement des opérations de lecture et d'écriture. Dans une configuration active-passive, un seul cluster MSK à la fois diffuse activement des données, tandis que l'autre cluster est en veille.

Considérations relatives à la création d'applications Apache Kafka multi-régions

Vos consommateurs doivent être en mesure de retraiter les messages dupliqués sans impact en aval. Le réplicateur MSK réplique les données, at-least-once ce qui peut entraîner des doublons dans le cluster de secours. Lorsque vous passez à la AWS région secondaire, vos consommateurs peuvent traiter les mêmes données plusieurs fois. Le réplicateur MSK donne la priorité à la copie des données plutôt qu'aux décalages destinés aux consommateurs pour de meilleures performances. Après un basculement, le consommateur peut commencer à lire des décalages antérieurs, ce qui entraîne un double traitement.

Les producteurs et les consommateurs doivent également accepter de perdre un minimum de données. Comme le réplicateur MSK réplique les données de manière asynchrone, lorsque la AWS région principale commence à rencontrer des défaillances, il n'y a aucune garantie que toutes les données soient répliquées dans la région secondaire. Vous pouvez utiliser la latence de réplication pour déterminer le maximum de données qui n'ont pas été copiées dans la région secondaire.

Utilisation d'une topologie de cluster actif-actif ou actif-passif

Une topologie de cluster actif-actif offre un temps de restauration proche de zéro et permet à votre application de streaming de fonctionner simultanément dans plusieurs régions AWS . Lorsqu'un cluster d'une région est endommagé, les applications connectées au cluster de l'autre région continuent de traiter les données.

Les configurations actives-passives sont adaptées aux applications qui ne peuvent s'exécuter que dans une seule région AWS à la fois, ou lorsque vous avez besoin d'un contrôle accru sur l'ordre de traitement des données. Les configurations actives-passives nécessitent un temps de restauration plus long que les configurations actives-actives, car vous devez démarrer l'ensemble de votre configuration active-passive, y compris vos producteurs et consommateurs, dans la région secondaire pour reprendre le streaming des données après un basculement.