Monitorar o encaminhamento de gravação local no Aurora PostgreSQL
Usando as seções a seguir, é possível monitorar o encaminhamento de gravação local nos clusters do Aurora PostgreSQL, incluindo métricas pertinentes do CloudWatch e eventos de espera com o objetivo de monitorar o desempenho e identificar possíveis problemas.
Métricas do Amazon CloudWatch e variáveis de status do Aurora PostgreSQL para encaminhamento de gravação
As métricas do Amazon CloudWatch a seguir se aplicam às instâncias de banco de dados do gravador quando o encaminhamento de gravação é utilizado em uma ou mais réplicas de leitura.
Métrica do CloudWatch | Unidades e descrição |
---|---|
|
Contagem (por segundo). Número de instruções DML encaminhadas processadas a cada segundo por essa instância de banco de dados de gravador. |
|
Contagem. Número de sessões abertas nessa instância de banco de dados de gravação que processa consultas encaminhadas. |
|
Contagem. Número de sessões encaminhadas na instância de banco de dados de gravação. |
As métricas do CloudWatch a seguir se aplicam a cada réplica de leitura. Essas métricas são medidas em cada instância de banco de dados do leitor em um cluster secundário com o encaminhamento de gravação local habilitado.
Métrica do CloudWatch | Unidade e descrição |
---|---|
|
Contagem (por segundo). Número de confirmações em sessões encaminhadas por essa réplica a cada segundo. |
|
Milissegundos. Tempo médio de resposta, em milissegundos, de DMLs encaminhadas na réplica. |
|
Contagem (por segundo). Número de instruções DML encaminhadas processadas por segundo nessa réplica. |
|
Contagem. Número de sessões rejeitadas pela instância de banco de dados do gravador por ter atingido o limite máximo de conexões ou o máximo de conexões de encaminhamento de gravação. |
|
Contagem. O número de sessões que estão usando o encaminhamento de gravação local em uma instância de réplica. |
|
Milissegundos. Tempo médio de espera, em milissegundos, que a réplica aguarda para ser consistente com o LSN da instância de banco de dados do gravador. O grau em que a instância de banco de dados de leitura aguarda depende da configuração apg_write_forward.consistency_mode . Para obter mais informações sobre essa configuração, consulte Parâmetros de configuração para o encaminhamento de gravação no Aurora PostgreSQL. |
Eventos de espera para encaminhamento de gravação local no Aurora PostgreSQL
O Amazon Aurora gera os seguintes eventos de espera quando você usa o encaminhamento de gravação com o Aurora PostgreSQL.
Tópicos
IPC:AuroraWriteForwardConnect
O evento IPC:AuroraWriteForwardConnect
ocorre quando um processo de backend na réplica de leitura está aguardando a abertura de uma conexão com a instância de banco de dados do gravador.
Possíveis causas do maior número de esperas
Esse evento aumenta à medida que aumenta o número de tentativas de conexão de uma réplica de leitura no nó do gravador.
Ações
Reduza o número de conexões simultâneas de uma réplica de leitura no nó do gravador.
IPC:AuroraWriteForwardConsistencyPoint
O evento IPC:AuroraWriteForwardConsistencyPoint
descreve por quanto tempo uma consulta de um nó na réplica de leitura aguardará até que os resultados das operações de gravação encaminhadas sejam replicados na região atual. Esse evento só será gerado se o parâmetro do nível da sessão apg_write_forward.consistency_mode
estiver definido como um dos seguintes casos:
SESSION
: as consultas em uma réplica de leitura aguardam os resultados de todas as alterações feitas nessa sessão.GLOBAL
: as consultas em uma réplica de leitura aguardam os resultados das alterações feitas por essa sessão, além de todas as alterações confirmadas da instância de banco de dados do gravador e da réplica de leitura.
Para obter informações sobre as configurações do parâmetro apg_write_forward.consistency_mode
, consulte Parâmetros de configuração para o encaminhamento de gravação no Aurora PostgreSQL.
Possíveis causas do maior número de esperas
As causas comuns de tempos de espera mais longos incluem o seguinte:
Aumento do atraso na réplica, conforme medido pela métrica do Amazon CloudWatch
ReplicaLag
. Para obter mais informações sobre essa métrica, consulte Monitorar a replicação do Aurora PostgreSQL.Maior carga na instância de banco de dados do gravador ou na réplica de leitura.
Ações
Altere seu modo de consistência, dependendo dos requisitos da aplicação.
IPC:AuroraWriteForwardExecute
O evento IPC:AuroraWriteForwardExecute
ocorre quando um processo de backend na réplica de leitura está aguardando a conclusão de uma consulta encaminhada e o recebimento dos resultados no nó do gravador do cluster de banco de dados.
Possíveis causas do maior número de esperas
As causas típicas incluem:
Buscar um grande número de linhas no nó do gravador.
O aumento da latência da rede entre o nó do gravador e a réplica de leitura aumenta o tempo necessário para a réplica de leitura receber dados do nó do gravador.
O aumento da carga na réplica de leitura pode atrasar a transmissão da solicitação de consulta da réplica de leitura para o nó do gravador.
O aumento da carga no nó do gravador pode atrasar a transmissão dos dados do nó do gravador para a réplica de leitura.
Ações
Recomenda-se ações distintas, dependendo dos motivos do evento de espera.
Otimize as consultas para recuperar somente os dados necessários.
Otimize as operações de linguagem de manipulação de dados (DML) para modificar somente os dados necessários.
Se a réplica de leitura ou o nó do gravador estiver limitado pela CPU ou pela largura de banda da rede, pense em alterá-lo para um tipo de instância com maior capacidade de CPU ou maior largura de banda da rede.
IPC:AuroraWriteForwardGetGlobalConsistencyPoint
O evento IPC:AuroraWriteForwardGetGlobalConsistencyPoint
ocorre quando um processo de backend na réplica de leitura que está usando o modo de consistência GLOBAL está esperando para receber o ponto de consistência global do nó do gravador antes de realizar uma consulta.
Possíveis causas do maior número de esperas
As causas típicas incluem:
O aumento da latência da rede entre a réplica de leitura e o nó do gravador aumenta o tempo necessário para a réplica de leitura receber dados do nó do gravador.
O aumento da carga na réplica de leitura pode atrasar a transmissão da solicitação de consulta da réplica de leitura para o nó do gravador.
O aumento da carga no nó do gravador pode atrasar a transmissão dos dados do nó do gravador para a réplica de leitura.
Ações
Recomenda-se ações distintas, dependendo dos motivos do evento de espera.
Altere seu modo de consistência, dependendo dos requisitos da aplicação.
Se a réplica de leitura ou o nó do gravador estiver limitado pela CPU ou pela largura de banda da rede, pense em alterá-lo para um tipo de instância com maior capacidade de CPU ou maior largura de banda da rede.
IPC:AuroraWriteForwardXactAbort
O evento IPC:AuroraWriteForwardXactAbort
ocorre quando um processo de backend na réplica de leitura está aguardando o resultado de uma consulta de limpeza remota. As consultas de limpeza são emitidas para retornar o processo ao estado apropriado após a interrupção de uma transação por gravação. O Amazon Aurora as executa porque um erro foi encontrado ou porque um usuário emitiu um comando ABORT
explícito ou cancelou uma consulta em execução.
Possíveis causas do maior número de esperas
As causas típicas incluem:
O aumento da latência da rede entre a réplica de leitura e o nó do gravador aumenta o tempo necessário para a réplica de leitura receber dados do nó do gravador.
O aumento da carga na réplica de leitura pode atrasar a transmissão da solicitação de consulta de limpeza da réplica de leitura para o nó do gravador.
O aumento da carga no nó do gravador pode atrasar a transmissão dos dados do nó do gravador para a réplica de leitura.
Ações
Recomenda-se ações distintas, dependendo dos motivos do evento de espera.
Investigue a causa da transação abortada.
Se a réplica de leitura ou a instância de banco de dados do gravador estiver limitada pela CPU ou pela largura de banda da rede, pense em alterá-la para um tipo de instância com maior capacidade de CPU ou maior largura de banda da rede.
IPC:AuroraWriteForwardXactCommit
O evento IPC:AuroraWriteForwardXactCommit
ocorre quando um processo de backend na réplica de leitura está aguardando o resultado de um comando de confirmação de transação encaminhado.
Possíveis causas do maior número de esperas
As causas típicas incluem:
O aumento da latência da rede entre a réplica de leitura e o nó do gravador aumenta o tempo necessário para a réplica de leitura receber dados do nó do gravador.
O aumento da carga na réplica de leitura pode atrasar a transmissão da solicitação de consulta da réplica de leitura para o nó do gravador.
O aumento da carga no nó do gravador pode atrasar a transmissão dos dados do nó do gravador para a réplica de leitura.
Ações
Se a réplica de leitura ou o nó do gravador estiver limitado pela CPU ou pela largura de banda da rede, pense em alterá-lo para um tipo de instância com maior capacidade de CPU ou maior largura de banda da rede.
IPC:AuroraWriteForwardXactStart
O evento IPC:AuroraWriteForwardXactStart
ocorre quando um processo de backend na réplica de leitura está aguardando o resultado de um comando de início de transação encaminhado.
Possíveis causas do maior número de esperas
As causas típicas incluem:
O aumento da latência da rede entre a réplica de leitura e o nó do gravador aumenta o tempo necessário para a réplica de leitura receber dados do nó do gravador.
O aumento da carga na réplica de leitura pode atrasar a transmissão da solicitação de consulta da réplica de leitura para o nó do gravador.
O aumento da carga no nó do gravador pode atrasar a transmissão dos dados do nó do gravador para a réplica de leitura.
Ações
Se a réplica de leitura ou o nó do gravador estiver limitado pela CPU ou pela largura de banda da rede, pense em alterá-lo para um tipo de instância com maior capacidade de CPU ou maior largura de banda da rede.