Métriques pour le transfert d’écriture Événements d’attente pour le transfert d’écriture local dans Aurora PostgreSQL

Surveillance du transfert d’écriture local dans Aurora PostgreSQL

À l'aide des sections suivantes, vous pouvez surveiller le transfert d'écriture local dans les clusters Aurora PostgreSQL, notamment les métriques CloudWatch pertinentes et les événements d'attente pour suivre les performances et identifier les problèmes potentiels.

Amazon CloudWatch Metrics et variables d'état Aurora PostgreSQL pour le transfert d'écriture

Les CloudWatch métriques Amazon suivantes s'appliquent aux instances de base de données Writer lorsque vous utilisez le transfert d'écriture sur une ou plusieurs répliques de lecture.

CloudWatch Métrique	Unités et description
`AuroraLocalForwardingWriterDMLThroughput`	Nombre (par seconde). Nombre d’instructions DML transférées traitées chaque seconde par cette instance de base de données d’enregistreur.
`AuroraLocalForwardingWriterOpenSessions`	Nombre. Nombre de sessions ouvertes sur cette instance de base de données d’enregistreur traitant les requêtes transmises.
`AuroraLocalForwardingWriterTotalSessions`	Nombre. Nombre total de sessions transférées sur cette instance de base de données d’enregistreur.

Les CloudWatch mesures suivantes s'appliquent à chaque réplique lue. Ces métriques sont mesurées sur chaque instance de base de données de lecteur dans un cluster de bases de données où le transfert d’écriture est activé.

CloudWatch Métrique	Unité et description
`AuroraForwardingReplicaCommitThroughput`	Nombre (par seconde). Nombre d’engagements dans les sessions transmises chaque seconde par ce réplica.
`AuroraForwardingReplicaDMLLatency`	Millisecondes. Temps de réponse moyen en millisecondes des DML transférées sur le réplica.
`AuroraForwardingReplicaDMLThroughput`	Nombre (par seconde). Nombre d’instructions DML transférées que ce réplica traite chaque seconde.
`AuroraForwardingReplicaErrorSessionsLimit`	Nombre. Nombre de sessions rejetées par l’instance de base de données de l’enregistreur, car le nombre maximal de connexions ou de connexions de transfert d’écriture a été atteint.
`AuroraForwardingReplicaOpenSessions`	Nombre. Nombre de sessions qui utilisent le transfert d’écriture local sur une instance de réplica.
`AuroraForwardingReplicaReadWaitLatency`	Millisecondes. Durée moyenne en millisecondes que le réplica attend pour être cohérent avec le LSN de l’instance de base de données de l’enregistreur. Le temps d’attente de l’instance de base de données de lecteur dépend du paramètre `apg_write_forward.consistency_mode`. Pour plus d’informations sur ce paramètre, consultez Paramètres de configuration pour le transfert d’écriture dans Aurora PostgreSQL.

Événements d’attente pour le transfert d’écriture local dans Aurora PostgreSQL

Amazon Aurora génère les événements d’attente suivants lorsque vous utilisez le transfert d’écriture avec Aurora PostgreSQL.

Rubriques

IPC:AuroraWriteForwardConnect
IPC:AuroraWriteForwardConsistencyPoint
IPC:AuroraWriteForwardExecute
IPC:AuroraWriteForwardGetGlobalConsistencyPoint
IPC:AuroraWriteForwardXactAbort
IPC:AuroraWriteForwardXactCommit
IPC:AuroraWriteForwardXactStart

IPC:AuroraWriteForwardConnect

L’événement IPC:AuroraWriteForwardConnect se produit lorsqu’un processus dorsal sur le réplica en lecture attend l’ouverture d’une connexion à l’instance de base de données d’enregistreur.

Causes probables de l’augmentation du nombre d’événements d’attente

Cet événement augmente à mesure que le nombre de tentatives de connexion du réplica en lecture au nœud d’enregistreur augmente.

Actions

Réduisez le nombre de connexions simultanées du réplica en lecture au nœud d’enregistreur.

IPC:AuroraWriteForwardConsistencyPoint

L’événement IPC:AuroraWriteForwardConsistencyPoint décrit la durée pendant laquelle une requête d’un nœud du réplica en lecture attend la réplication des résultats des opérations d’écriture transférées dans la région actuelle. Cet événement n’est généré que si le paramètre de niveau session apg_write_forward.consistency_mode est défini sur l’une des valeurs suivantes :

SESSION : les requêtes d’un réplica en lecture attendent les résultats de toutes les modifications apportées au cours de cette session.
GLOBAL : les requêtes d’un réplica en lecture attendent les résultats des modifications apportées par cette session, ainsi que toutes les modifications validées de l’instance de base de données d’enregistreur et du réplica en lecture.

Pour plus d’informations sur la configuration du paramètre apg_write_forward.consistency_mode, consultez Paramètres de configuration pour le transfert d’écriture dans Aurora PostgreSQL.

Causes probables de l’augmentation du nombre d’événements d’attente

Les causes fréquentes de l’allongement des temps d’attente sont les suivantes :

Augmentation du délai de réplication, tel que mesuré par la CloudWatch ReplicaLag métrique Amazon. Pour plus d’informations sur cette métrique, consultez Surveillance de la réplication Aurora PostgreSQL.
Charge accrue sur l’instance de base de données d’enregistreur ou sur le réplica en lecture.

Actions

Modifiez votre mode de cohérence en fonction des besoins de votre application.

IPC:AuroraWriteForwardExecute

L’événement IPC:AuroraWriteForwardExecute se produit lorsqu’un processus dorsal sur le réplica en lecture attend qu’une requête transférée se termine et obtienne des résultats du nœud d’enregistreur du cluster de bases de données.

Causes probables de l’augmentation du nombre d’événements d’attente

Les causes fréquentes de l’augmentation du nombre d’événements d’attente sont les suivantes :

Un grand nombre de lignes est récupéré à partir du nœud d’enregistreur.
Une augmentation de la latence du réseau entre le nœud d’enregistreur de et le réplica en lecture augmente le temps nécessaire au réplica en lecture pour recevoir les données du nœud d’enregistreur.
Une augmentation de la charge sur le réplica en lecture peut retarder la transmission de la demande de la requête entre le réplica en lecture et le nœud d’enregistreur.
Une augmentation de la charge sur le nœud d’enregistreur peut retarder la transmission des données entre le nœud d’enregistreur et le nœud secondaire.

Actions

Nous vous recommandons différentes actions en fonction des causes de votre événement d’attente.

Optimisez les requêtes pour récupérer uniquement les données nécessaires.
Optimisez les opérations DML (Data Manipulation Language) pour ne modifier que les données nécessaires.
Si le réplica en lecture ou le nœud d’enregistreur est limité par le processeur ou la bande passante du réseau, envisagez de le remplacer par un type d’instance doté d’une plus grande capacité de processeur ou de bande passante.

IPC:AuroraWriteForwardGetGlobalConsistencyPoint

L’événement IPC:AuroraWriteForwardGetGlobalConsistencyPoint se produit lorsqu’un processus dorsal sur le réplica en lecture qui utilise le mode de cohérence GLOBAL attend d’obtenir le point de cohérence global auprès du nœud d’enregistreur avant d’exécuter une requête.

Causes probables de l’augmentation du nombre d’événements d’attente

Les causes fréquentes de l’augmentation du nombre d’événements d’attente sont les suivantes :

Une augmentation de la latence du réseau entre le réplica en lecture et le nœud d’enregistreur augmente le temps nécessaire au réplica en lecture pour recevoir les données du nœud d’enregistreur.
Une augmentation de la charge sur le réplica en lecture peut retarder la transmission de la demande de la requête entre le réplica en lecture et le nœud d’enregistreur.
Une augmentation de la charge sur le nœud d’enregistreur peut retarder la transmission des données entre le nœud d’enregistreur et le nœud secondaire.

Actions

Nous vous recommandons différentes actions en fonction des causes de votre événement d’attente.

Modifiez votre mode de cohérence en fonction des besoins de votre application.
Si le réplica en lecture ou le nœud d’enregistreur est limité par le processeur ou la bande passante du réseau, envisagez de le remplacer par un type d’instance doté d’une plus grande capacité de processeur ou de bande passante.

IPC:AuroraWriteForwardXactAbort

L’événement IPC:AuroraWriteForwardXactAbort se produit lorsqu’un processus dorsal sur le réplica en lecture attend le résultat d’une requête de nettoyage à distance. Des requêtes de nettoyage sont émises pour remettre le processus dans l’état approprié après l’abandon d’une transaction de transfert d’écriture. Amazon Aurora les exécute soit parce qu’une erreur a été détectée, soit parce qu’un utilisateur a émis une commande ABORT explicite ou annulé une requête en cours d’exécution.

Causes probables de l’augmentation du nombre d’événements d’attente

Les causes fréquentes de l’augmentation du nombre d’événements d’attente sont les suivantes :

Une augmentation de la latence du réseau entre le réplica en lecture et le nœud d’enregistreur augmente le temps nécessaire au réplica en lecture pour recevoir les données du nœud d’enregistreur.
Une augmentation de la charge sur le réplica en lecture peut retarder la transmission de la demande associée à la requête de nettoyage du réplica en lecture au nœud d’enregistreur.
Une augmentation de la charge sur le nœud d’enregistreur peut retarder la transmission des données entre le nœud d’enregistreur et le nœud secondaire.

Actions

Nous vous recommandons différentes actions en fonction des causes de votre événement d’attente.

Recherchez la cause de l’annulation de la transaction.
Si le réplica en lecture ou l’instance de base de données d’enregistreur est limité par le processeur ou la bande passante du réseau, envisagez de le remplacer par un type d’instance doté d’une plus grande capacité de processeur ou de bande passante.

IPC:AuroraWriteForwardXactCommit

L’événement IPC:AuroraWriteForwardXactCommit se produit lorsqu’un processus dorsal sur le réplica en lecture attend le résultat d’une commande transférée de type commit transaction.

Causes probables de l’augmentation du nombre d’événements d’attente

Les causes fréquentes de l’augmentation du nombre d’événements d’attente sont les suivantes :

Une augmentation de la latence du réseau entre le réplica en lecture et le nœud d’enregistreur augmente le temps nécessaire au réplica en lecture pour recevoir les données du nœud d’enregistreur.
Une augmentation de la charge sur le réplica en lecture peut retarder la transmission de la demande de la requête entre le réplica en lecture et le nœud d’enregistreur.
Une augmentation de la charge sur le nœud d’enregistreur peut retarder la transmission des données entre le nœud d’enregistreur et le nœud secondaire.

Actions

Si le réplica en lecture ou le nœud d’enregistreur est limité par le processeur ou la bande passante du réseau, envisagez de le remplacer par un type d’instance doté d’une plus grande capacité de processeur ou de bande passante.

IPC:AuroraWriteForwardXactStart

L’événement IPC:AuroraWriteForwardXactStart se produit lorsqu’un processus dorsal sur le réplica en lecture attend le résultat d’une commande start transaction transférée.

Causes probables de l’augmentation du nombre d’événements d’attente

Les causes fréquentes de l’augmentation du nombre d’événements d’attente sont les suivantes :

Une augmentation de la latence du réseau entre le réplica en lecture et le nœud d’enregistreur augmente le temps nécessaire au réplica en lecture pour recevoir les données du nœud d’enregistreur.
Une augmentation de la charge sur le réplica en lecture peut retarder la transmission de la demande de la requête entre le réplica en lecture et le nœud d’enregistreur.
Une augmentation de la charge sur le nœud d’enregistreur peut retarder la transmission des données entre le nœud d’enregistreur et le nœud secondaire.

Actions

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utilisation du transfert d’écriture local pour Aurora PostgreSQL

Utilisation d’Aurora PostgreSQL comme base de connaissances pour Amazon Bedrock