View a markdown version of this page

Limitação de gravação de pesquisa - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Limitação de gravação de pesquisa

Para manter o desempenho ideal e a durabilidade dos dados, ElastiCache no modo durável implementa a limitação de gravação no tráfego de pesquisa quando necessário. A limitação ajuda a garantir que os mecanismos de backup automático operem com eficiência sem atrasos durante períodos de alta atividade de gravação. Ao reduzir temporariamente a taxa de transferência de gravação, o sistema preserva a integridade do registro Multi-AZ transacional, que é essencial para a rápida recuperação e reinicialização do banco de dados.

Escopo da limitação

Somente comandos de gravação direcionados a chaves que pertencem a um índice de pesquisa são limitados. Grava em chaves não indexadas e todos os comandos de leitura não são afetados.

Os comandos a seguir estão sujeitos à limitação quando têm como alvo chaves indexadas:

Comandos sujeitos à limitação de pesquisa e gravação
Categoria Comandos
Hash HSET, HSETNX, HMSET, HINCRBY, HINCRBYFLOAT, HDEL
JSON JSON.SET, JSON.DEL, JSON.NUMINCRBY, JSON.NUMMULTBY, JSON.STRAPPEND, JSON.ARRAPPEND, JSON.ARRINSERT, JSON.ARRPOP, JSON.ARRTRIM, JSON.TOGGLE, JSON.CLEAR, JSON.MERGE
Genérico DEL, UNLINK, RENAME, RENAMENX, COPY, RESTORE

O que os clientes experimentam

Os comandos limitados são atrasados, não rejeitados. As gravações afetadas demoram mais para serem concluídas, mas ainda assim são bem-sucedidas. Nenhum erro é devolvido ao cliente.

Você pode observar o impacto por meio das seguintes CloudWatch métricas da Amazon:

  • SuccessfulWriteRequestLatencye SearchBasedSetCmdsLatency — Reflita o aumento da latência nas gravações afetadas.

  • SearchWriteThrottleActive,SearchWriteThrottledClientsCount, e SearchWriteThrottleEvents — Indique se a aceleração está ativa e em que grau. Para mais detalhes, consulte Monitoramento.

Quando a aceleração é ativada

O sistema monitora o uso da CPU dos encadeamentos de gravação do módulo de pesquisa em uma janela contínua de 2 horas. A limitação é ativada quando o uso médio da CPU durante essa janela excede 50% e ajusta a taxa de gravação permitida para trazer a utilização média de volta para 50%.

Como a média da métrica é calculada em uma janela de 2 horas, surtos curtos de uso elevado da CPU não acionam a aceleração sozinhos, desde que sejam compensados por um menor uso na mesma janela.

Para evitar a aceleração excessiva, o sistema também avalia o uso atual da CPU em tempo real. Se o uso atual da CPU já estiver em 50% ou menos, o sistema mantém a taxa de gravação estável em vez de reduzi-la ainda mais, mesmo que a média de 2 horas permaneça acima do limite. Isso garante que a capacidade de gravação nunca fique abaixo de 50% da taxa de transferência normal.

Quando a aceleração é desativada

Quando o uso médio da CPU em 2 horas cai abaixo de 50%, o sistema aumenta gradualmente a taxa de gravação permitida até que a taxa de transferência total seja restaurada e a aceleração seja desativada.

Monitoramento

As seguintes CloudWatch métricas da Amazon estão disponíveis para monitorar a limitação de gravação de pesquisas:

Métricas de CloudWatch limitação de gravação de pesquisas
Métrica Description Unidade
SearchWriteThrottleActive Indica se a limitação está ativa no momento. 1= ativo, 0 = inativo. Booleano
SearchWriteThrottledClientsCount O número de conexões de clientes que estão sendo limitadas no momento. Contagem
SearchWriteThrottleEvents O número de eventos de aceleração dentro do intervalo de emissão de relatórios. Contagem
SearchWriteCPUUtilization Utilização atual da CPU dos segmentos do gravador de pesquisa. Percentual

Práticas recomendadas

  • Monitore SearchWriteCPUUtilization — acompanhe o uso da CPU de gravação e pesquisa para entender seus padrões de carga de trabalho e prever quando você poderá se aproximar do limite de limitação.

  • Monitore SearchWriteThrottleActive — Acompanhe se a limitação está ativa para que você possa investigar e responder prontamente.

  • Planeje a ingestão sustentada em torno da janela de 2 horas — O sistema usa uma média contínua de 2 horas, portanto, surtos curtos de alta atividade de gravação são totalmente suportados, desde que sejam compensados pelo menor uso na mesma janela.

  • Dimensione seu cluster se você observar uma limitação sustentada ou frequente — Se sua carga de trabalho exceder consistentemente o limite e a limitação afetar os requisitos de latência do seu aplicativo, considere escalar para aumentar a capacidade.