Surveillance du transfert d'écriture local dans Aurora Postgre SQL - Amazon Aurora

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillance du transfert d'écriture local dans Aurora Postgre SQL

À l'aide des sections suivantes, vous pouvez surveiller le transfert d'écriture local dans les SQL clusters Aurora Postgre, y compris les CloudWatch mesures pertinentes et les événements d'attente pour suivre les performances et identifier les problèmes potentiels.

CloudWatch Métriques Amazon et variables d'SQLétat Aurora Postgre pour le transfert d'écriture

Les CloudWatch métriques Amazon suivantes s'appliquent aux instances de base de données Writer lorsque vous utilisez le transfert d'écriture sur une ou plusieurs répliques de lecture.

CloudWatch Métrique

Unités et description

AuroraLocalForwardingWriterDMLThroughput

Nombre (par seconde). Nombre d'DMLinstructions transmises traitées chaque seconde par cette instance de base de données Writer.

AuroraLocalForwardingWriterOpenSessions

Nombre. Nombre de sessions ouvertes sur cette instance de base de données d'enregistreur traitant les requêtes transmises.

AuroraLocalForwardingWriterTotalSessions

Nombre. Nombre total de sessions transférées sur cette instance de base de données d'enregistreur.

Les CloudWatch mesures suivantes s'appliquent à chaque réplique lue. Ces métriques sont mesurées sur chaque instance de base de données de lecteur du cluster de base de données lorsque le transfert d'écriture local est activé.

CloudWatch Métrique

Unité et description

AuroraForwardingReplicaCommitThroughput

Nombre (par seconde). Nombre d'engagements dans les sessions transmises chaque seconde par ce réplica.

AuroraForwardingReplicaDMLLatency

Millisecondes. Temps de réponse moyen en millisecondes après le transfert lors de la réplication. DMLs

AuroraForwardingReplicaDMLThroughput

Nombre (par seconde). Nombre de DML relevés transmis traités sur cette réplique chaque seconde.

AuroraForwardingReplicaErrorSessionsLimit

Nombre. Nombre de sessions rejetées par l'instance de base de données Writer parce que la limite maximale de connexions ou de connexions d'écriture différée a été atteinte.

AuroraForwardingReplicaOpenSessions

Nombre. Nombre de sessions utilisant le transfert d'écriture local sur une instance de réplique.

AuroraForwardingReplicaReadWaitLatency

Millisecondes. Temps d'attente moyen en millisecondes pendant lequel la réplique attend pour être cohérent avec celui de l'instance de base LSN de données du rédacteur. Le temps d'attente de l'instance en lecture de la base de données dépend du paramètre apg_write_forward.consistency_mode. Pour plus d'informations sur ce paramètre, consultez Paramètres de configuration pour le transfert d'écriture dans Aurora PostgreSQL.

Événements d'attente pour le transfert d'écriture local dans Aurora Postgre SQL

Amazon Aurora génère les événements d'attente suivants lorsque vous utilisez le transfert d'écriture avec Aurora PostgreSQL.

IPC:AuroraWriteForwardConnect

L'IPC:AuroraWriteForwardConnectévénement se produit lorsqu'un processus principal sur la réplique en lecture attend l'ouverture d'une connexion à l'instance de base de données du rédacteur.

Causes probables de l'allongement des temps d'attente

Cet événement augmente à mesure que le nombre de tentatives de connexion entre une réplique en lecture et le nœud d'écriture augmente.

Actions

Réduisez le nombre de connexions simultanées entre une réplique en lecture et le nœud d'écriture.

IPC:AuroraWriteForwardConsistencyPoint

L'IPC:AuroraWriteForwardConsistencyPointévénement décrit la durée pendant laquelle une requête provenant d'un nœud sur la réplique en lecture attendra les résultats des opérations d'écriture transférées pour être répliqués dans la région actuelle. Cet événement n'est généré que si le paramètre de niveau session apg_write_forward.consistency_mode est défini sur l'une des valeurs suivantes :

  • SESSION— les requêtes sur une réplique en lecture attendent les résultats de toutes les modifications apportées au cours de cette session.

  • GLOBAL— les requêtes sur une réplique en lecture attendent les résultats des modifications apportées par cette session, ainsi que toutes les modifications validées depuis l'instance de base de données Writer et la réplique en lecture.

Pour plus d'informations sur la configuration du paramètre apg_write_forward.consistency_mode, consultez Paramètres de configuration pour le transfert d'écriture dans Aurora PostgreSQL.

Causes probables de l'allongement des temps d'attente

Les causes fréquentes de l'allongement des temps d'attente sont les suivantes :

  • Augmentation du délai de réplication, tel que mesuré par la CloudWatch ReplicaLag métrique Amazon. Pour plus d'informations sur cette métrique, consultez Surveillance de la réplication Aurora PostgreSQL.

  • Charge accrue sur l'instance de base de données d'écriture ou sur la réplique de lecture.

Actions

Modifiez votre mode de cohérence en fonction des besoins de votre application.

IPC:AuroraWriteForwardExecute

L'IPC:AuroraWriteForwardExecuteévénement se produit lorsqu'un processus principal sur la réplique lue attend qu'une requête transférée soit terminée et obtienne des résultats auprès du nœud d'écriture du cluster de base de données.

Causes probables de l'allongement des temps d'attente

Les causes fréquentes de l'allongement des temps d'attente sont les suivantes :

  • Récupération d'un grand nombre de lignes depuis le nœud d'écriture.

  • L'augmentation de la latence réseau entre le nœud d'écriture et la réplique de lecture augmente le temps nécessaire à la réplique de lecture pour recevoir les données du nœud d'écriture.

  • Une charge accrue sur la réplique de lecture peut retarder la transmission de la demande de requête de la réplique de lecture au nœud d'écriture.

  • L'augmentation de la charge sur le nœud d'écriture peut retarder la transmission des données du nœud d'écriture vers la réplique de lecture.

Actions

Nous vous recommandons différentes actions en fonction des causes de votre événement d'attente.

  • Optimisez les requêtes pour récupérer uniquement les données nécessaires.

  • Optimisez les opérations du langage de manipulation des données (DML) pour ne modifier que les données nécessaires.

  • Si le nœud de lecture, de réplication ou d'écriture est limité par CPU la bande passante du réseau, envisagez de le remplacer par un type d'instance doté d'une plus CPU grande capacité ou d'une plus grande bande passante réseau.

IPC:AuroraWriteForwardGetGlobalConsistencyPoint

L'IPC:AuroraWriteForwardGetGlobalConsistencyPointévénement se produit lorsqu'un processus principal de la réplique de lecture utilisant le mode de GLOBAL cohérence attend d'obtenir le point de cohérence global auprès du nœud d'écriture avant d'exécuter une requête.

Causes probables de l'allongement des temps d'attente

Les causes fréquentes de l'allongement des temps d'attente sont les suivantes :

  • L'augmentation de la latence réseau entre le nœud de lecture et le nœud d'écriture augmente le temps nécessaire à la réplique de lecture pour recevoir les données du nœud d'écriture.

  • Une charge accrue sur la réplique de lecture peut retarder la transmission de la demande de requête de la réplique de lecture au nœud d'écriture.

  • L'augmentation de la charge sur le nœud d'écriture peut retarder la transmission des données du nœud d'écriture vers la réplique de lecture.

Actions

Nous vous recommandons différentes actions en fonction des causes de votre événement d'attente.

  • Modifiez votre mode de cohérence en fonction des besoins de votre application.

  • Si le nœud de lecture, de réplication ou d'écriture est limité par CPU la bande passante du réseau, envisagez de le remplacer par un type d'instance doté d'une plus CPU grande capacité ou d'une plus grande bande passante réseau.

IPC:AuroraWriteForwardXactAbort

L'IPC:AuroraWriteForwardXactAbortévénement se produit lorsqu'un processus principal de la réplique lue attend le résultat d'une requête de nettoyage à distance. Des requêtes de nettoyage sont émises pour remettre le processus dans l'état approprié après l'abandon d'une transaction de transfert d'écriture. Amazon Aurora les exécute soit parce qu'une erreur a été détectée, soit parce qu'un utilisateur a émis une commande ABORT explicite ou annulé une requête en cours d'exécution.

Causes probables de l'allongement des temps d'attente

Les causes fréquentes de l'allongement des temps d'attente sont les suivantes :

  • L'augmentation de la latence réseau entre le nœud de lecture et le nœud d'écriture augmente le temps nécessaire à la réplique de lecture pour recevoir les données du nœud d'écriture.

  • L'augmentation de la charge sur la réplique de lecture peut retarder la transmission de la demande de nettoyage de la réplique de lecture au nœud d'écriture.

  • L'augmentation de la charge sur le nœud d'écriture peut retarder la transmission des données du nœud d'écriture vers la réplique de lecture.

Actions

Nous vous recommandons différentes actions en fonction des causes de votre événement d'attente.

  • Recherchez la cause de l'annulation de la transaction.

  • Si l'instance de base de données de lecture, de réplication ou d'écriture est limitée par CPU la bande passante du réseau, envisagez de la remplacer par un type d'instance doté d'une CPU capacité ou d'une bande passante réseau plus importantes.

IPC:AuroraWriteForwardXactCommit

L'IPC:AuroraWriteForwardXactCommitévénement se produit lorsqu'un processus principal sur la réplique lue attend le résultat d'une commande de transaction de validation transférée.

Causes probables de l'allongement des temps d'attente

Les causes fréquentes de l'allongement des temps d'attente sont les suivantes :

  • L'augmentation de la latence réseau entre le nœud de lecture et le nœud d'écriture augmente le temps nécessaire à la réplique de lecture pour recevoir les données du nœud d'écriture.

  • Une charge accrue sur la réplique de lecture peut retarder la transmission de la demande de requête de la réplique de lecture au nœud d'écriture.

  • L'augmentation de la charge sur le nœud d'écriture peut retarder la transmission des données du nœud d'écriture vers la réplique de lecture.

Actions

Si le nœud de lecture, de réplication ou d'écriture est limité par CPU la bande passante du réseau, envisagez de le remplacer par un type d'instance doté d'une plus CPU grande capacité ou d'une plus grande bande passante réseau.

IPC:AuroraWriteForwardXactStart

L'IPC:AuroraWriteForwardXactStartévénement se produit lorsqu'un processus principal sur la réplique lue attend le résultat d'une commande de transaction de démarrage transférée.

Causes probables de l'allongement des temps d'attente

Les causes fréquentes de l'allongement des temps d'attente sont les suivantes :

  • L'augmentation de la latence réseau entre le nœud de lecture et le nœud d'écriture augmente le temps nécessaire à la réplique de lecture pour recevoir les données du nœud d'écriture.

  • Une charge accrue sur la réplique de lecture peut retarder la transmission de la demande de requête de la réplique de lecture au nœud d'écriture.

  • L'augmentation de la charge sur le nœud d'écriture peut retarder la transmission des données du nœud d'écriture vers la réplique de lecture.

Actions

Si le nœud de lecture, de réplication ou d'écriture est limité par CPU la bande passante du réseau, envisagez de le remplacer par un type d'instance doté d'une plus CPU grande capacité ou d'une plus grande bande passante réseau.