Supervisión del reenvío de escritura local en Aurora PostgreSQL - Amazon Aurora

Supervisión del reenvío de escritura local en Aurora PostgreSQL

En las siguientes secciones, puede supervisar el reenvío de escritura local en los clústeres de Aurora PostgreSQL, incluidas las métricas pertinentes de CloudWatch y los eventos de espera para realizar un seguimiento del rendimiento e identificar posibles problemas.

Métricas de Amazon CloudWatch y variables de estado de Aurora MySQL para el reenvío de escritura

Las siguientes métricas de Amazon CloudWatch se aplican a las instancias de base de datos del escritor cuando se utiliza el reenvío de escritura en una o más réplicas de lectura.

Métrica de CloudWatch

Unidades y descripción

AuroraLocalForwardingWriterDMLThroughput

Recuento por segundo Número de instrucciones DML reenviadas procesadas cada segundo por esta instancia de base de datos de escritor.

AuroraLocalForwardingWriterOpenSessions

Recuento Número de sesiones abiertas en esta instancia de base de datos de escritor que procesa las consultas reenviadas.

AuroraLocalForwardingWriterTotalSessions

Recuento Número total de sesiones reenviadas en esta instancia de base de datos de escritor.

Las siguientes métricas de CloudWatch se aplican a cada réplica de lectura. Estas métricas se miden en cada instancia de base de datos del lector de un clúster de base de datos con el reenvío de escritura local habilitado.

Métrica de CloudWatch

Unidad y descripción

AuroraForwardingReplicaCommitThroughput

Recuento por segundo Número de confirmaciones en las sesiones reenviadas por esta réplica cada segundo.

AuroraForwardingReplicaDMLLatency

Milisegundos. Tiempo medio de respuesta en milisegundos de los DML reenviados durante la réplica.

AuroraForwardingReplicaDMLThroughput

Recuento por segundo Número de instrucciones DML reenviadas procesadas en esta réplica por segundo.

AuroraForwardingReplicaErrorSessionsLimit

Recuento Número de sesiones rechazadas por la instancia de base de datos del escritor porque se ha alcanzado el límite máximo de conexiones o el límite máximo de conexiones de reenvío de escritura.

AuroraForwardingReplicaOpenSessions

Recuento Número de sesiones que utilizan el reenvío de escritura en una instancia de réplica local.

AuroraForwardingReplicaReadWaitLatency

Milisegundos. Tiempo de espera medio en milisegundos que la réplica espera para ser coherente con el LSN de la instancia de base de datos de escritura. El grado en que la instancia de base de datos de lector espera depende de la configuración apg_write_forward.consistency_mode. Para obtener información sobre esta configuración, consulte Parámetros de configuración para el reenvío de escritura en Aurora PostgreSQL.

Eventos de espera para el reenvío de escritura local en Aurora PostgreSQL

Amazon Aurora genera los siguientes eventos de espera cuando utiliza el reenvío de escritura con Aurora PostgreSQL.

IPC:AuroraWriteForwardConnect

El evento IPC:AuroraWriteForwardConnect se produce cuando un proceso de backend de la réplica de lectura espera a que se abra una conexión con la instancia de base de datos del escritor.

Causas probables del aumento del tiempo de espera

Este evento aumenta a medida que se incrementa el número de intentos de conexión desde una réplica de lectura en el nodo del escritor.

Acciones

Reduzca el número de conexiones simultáneas desde una réplica de lectura en el nodo del escritor.

IPC:AuroraWriteForwardConsistencyPoint

El evento IPC:AuroraWriteForwardConsistencyPoint describe cuánto tiempo esperará una consulta de un nodo en la réplica de lectura para que los resultados de las operaciones de escritura reenviadas se repliquen en la región actual. Este evento solo se genera si el parámetro de nivel de sesión apg_write_forward.consistency_mode se establece en uno de los siguientes valores:

  • SESSION: las consultas de una réplica de lectura esperan los resultados de todos los cambios realizados en esa sesión.

  • GLOBAL: las consultas de una réplica de lectura esperan los resultados de los cambios realizados en esa sesión, además de todos los cambios confirmados tanto de la instancia de base de datos del escritor como de la réplica de lectura.

Para obtener más información sobre la configuración del parámetro apg_write_forward.consistency_mode, consulte Parámetros de configuración para el reenvío de escritura en Aurora PostgreSQL.

Causas probables del aumento del tiempo de espera

Algunas de las causas más comunes que provocan tiempos de espera más largos son las siguientes:

  • Aumento del retraso de réplica, medido por la métrica ReplicaLag de Amazon CloudWatch. Para obtener más información sobre esta métrica, consulte Monitoreo de replicación de Aurora PostgreSQL.

  • Aumento de la carga en la instancia de base de datos del escritor o en la réplica de lectura.

Acciones

Cambie el modo de coherencia según los requisitos de su aplicación.

IPC:AuroraWriteForwardExecute

El evento IPC:AuroraWriteForwardExecute se produce cuando un proceso de backend de la réplica de lectura está esperando a que una consulta reenviada se complete y se obtengan los resultados del nodo del escritor del clúster de base de datos.

Causas probables del aumento del tiempo de espera

Algunas de las causas más comunes que provocan tiempos de espera más largos son las siguientes:

  • Obtención de una gran cantidad de filas del nodo del escritor.

  • El aumento de la latencia de la red entre el nodo del escritor y la réplica de lectura incrementa el tiempo que tarda la réplica de lectura en recibir datos del nodo del escritor.

  • El aumento de la carga en la réplica de lectura puede retrasar la transmisión de la solicitud de consulta desde la réplica de lectura hasta el nodo del escritor.

  • El aumento de la carga en el nodo del escritor puede retrasar la transmisión de los datos desde el nodo del escritor hasta la réplica de lectura.

Acciones

Recomendamos diferentes acciones en función de las causas del evento de espera.

  • Optimice las consultas para recuperar solo los datos necesarios.

  • Optimice las operaciones de lenguaje de manipulación de datos (DML) para modificar únicamente los datos necesarios.

  • Si la réplica de lectura o el nodo del escritor están limitados por la CPU o por el ancho de banda de la red, puede cambiarlo por un tipo de instancia con más capacidad de CPU o más ancho de banda.

IPC:AuroraWriteForwardGetGlobalConsistencyPoint

El evento IPC:AuroraWriteForwardGetGlobalConsistencyPoint se produce cuando un proceso de backend de la réplica de lectura que utiliza el modo de coherencia GLOBAL está esperando para obtener el punto de coherencia global del nodo del escritor antes de ejecutar una consulta.

Causas probables del aumento del tiempo de espera

Algunas de las causas más comunes que provocan tiempos de espera más largos son las siguientes:

  • El aumento de la latencia de la red entre la réplica de lectura y el nodo del escritor incrementa el tiempo que tarda la réplica de lectura en recibir datos del nodo del escritor.

  • El aumento de la carga en la réplica de lectura puede retrasar la transmisión de la solicitud de consulta desde la réplica de lectura hasta el nodo del escritor.

  • El aumento de la carga en el nodo del escritor puede retrasar la transmisión de los datos desde el nodo del escritor hasta la réplica de lectura.

Acciones

Recomendamos diferentes acciones en función de las causas del evento de espera.

  • Cambie el modo de coherencia según los requisitos de su aplicación.

  • Si la réplica de lectura o el nodo del escritor están limitados por la CPU o por el ancho de banda de la red, puede cambiarlo por un tipo de instancia con más capacidad de CPU o más ancho de banda.

IPC:AuroraWriteForwardXactAbort

El evento IPC:AuroraWriteForwardXactAbort se produce cuando un proceso de backend de la réplica de lectura está esperando el resultado de una consulta de limpieza remota. Las consultas de limpieza se emiten para devolver el proceso al estado correspondiente después de cancelar una transacción de reenvío de escritura. Amazon Aurora las ejecuta porque ha detectado un error o porque un usuario ha emitido un comando ABORT explícito o ha cancelado una consulta en ejecución.

Causas probables del aumento del tiempo de espera

Algunas de las causas más comunes que provocan tiempos de espera más largos son las siguientes:

  • El aumento de la latencia de la red entre la réplica de lectura y el nodo del escritor incrementa el tiempo que tarda la réplica de lectura en recibir datos del nodo del escritor.

  • El aumento de la carga en la réplica de lectura puede retrasar la transmisión de la solicitud de consulta de limpieza desde la réplica de lectura al nodo del escritor.

  • El aumento de la carga en el nodo del escritor puede retrasar la transmisión de los datos desde el nodo del escritor hasta la réplica de lectura.

Acciones

Recomendamos diferentes acciones en función de las causas del evento de espera.

  • Investigue por qué se ha cancelado la transacción.

  • Si la réplica de lectura o la instancia de base de datos del escritor están limitadas por la CPU o por el ancho de banda de la red, puede cambiarlo por un tipo de instancia con más capacidad de CPU o más ancho de banda.

IPC:AuroraWriteForwardXactCommit

El evento IPC:AuroraWriteForwardXactCommit se produce cuando un proceso de backend de la réplica de lectura está esperando el resultado de un comando de transacción de confirmación reenviado.

Causas probables del aumento del tiempo de espera

Algunas de las causas más comunes que provocan tiempos de espera más largos son las siguientes:

  • El aumento de la latencia de la red entre la réplica de lectura y el nodo del escritor incrementa el tiempo que tarda la réplica de lectura en recibir datos del nodo del escritor.

  • El aumento de la carga en la réplica de lectura puede retrasar la transmisión de la solicitud de consulta desde la réplica de lectura hasta el nodo del escritor.

  • El aumento de la carga en el nodo del escritor puede retrasar la transmisión de los datos desde el nodo del escritor hasta la réplica de lectura.

Acciones

Si la réplica de lectura o el nodo del escritor están limitados por la CPU o por el ancho de banda de la red, puede cambiarlo por un tipo de instancia con más capacidad de CPU o más ancho de banda.

IPC:AuroraWriteForwardXactStart

El evento IPC:AuroraWriteForwardXactStart se produce cuando un proceso de backend de la réplica de lectura está esperando el resultado de un comando de transacción de inicio reenviado.

Causas probables del aumento del tiempo de espera

Algunas de las causas más comunes que provocan tiempos de espera más largos son las siguientes:

  • El aumento de la latencia de la red entre la réplica de lectura y el nodo del escritor incrementa el tiempo que tarda la réplica de lectura en recibir datos del nodo del escritor.

  • El aumento de la carga en la réplica de lectura puede retrasar la transmisión de la solicitud de consulta desde la réplica de lectura hasta el nodo del escritor.

  • El aumento de la carga en el nodo del escritor puede retrasar la transmisión de los datos desde el nodo del escritor hasta la réplica de lectura.

Acciones

Si la réplica de lectura o el nodo del escritor están limitados por la CPU o por el ancho de banda de la red, puede cambiarlo por un tipo de instancia con más capacidad de CPU o más ancho de banda.