Métricas para o Valkey e Redis OSS - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Métricas para o Valkey e Redis OSS

O namespace Amazon ElastiCache inclui as seguintes métricas do Valkey e Redis OSS. Essas métricas são as mesmas quando se usa o mecanismo Valkey.

Com exceção deReplicationLag,, EngineCPUUtilizationSuccessfulWriteRequestLatency, eSuccessfulReadRequestLatency, essas métricas são derivadas do info comando. Cada métrica é calculada no nível de nó de cache.

Para obter a documentação completa do info comando, consulte http://valkey. io/commands/info.

Consulte também

Métrica Descrição Unidade
ActiveDefragHits O número de realocações de valor por minuto executada pelo processo de desfragmentação ativo. Deriva da estatística active_defrag_hits no comando INFO. Número
AuthenticationFailures O número total de tentativas falhadas de autenticação para o Valkey ou Redis OSS usando o comando AUTH. É possível encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
BytesUsedForCache O número total de bytes alocados pelo Valkey ou Redis OSS para todas as finalidades, inclusive o conjunto de dados, buffers, etc. Bytes
Dimension: Tier=Memory para clusters do Valkey ou Redis OSS usando Hierarquização de dados em ElastiCache: o número total de bytes usados para cache por memória. Esse é o valor da estatística used_memory em INFO. Bytes
Dimension: Tier=SSD para clusters do Valkey ou Redis OSS usando Hierarquização de dados em ElastiCache: o número total de bytes usados para cache por SSD. Bytes
BytesReadFromDisk O número total de bytes lidos no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Bytes
BytesWrittenToDisk O número total de bytes gravados no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Bytes
CacheHits O número de buscas de chaves somente leitura bem-sucedidas no dicionário principal. Deriva da estatística keyspace_hits no comando INFO. Contagem
CacheMisses O número de buscas de chaves somente leitura malsucedidas no dicionário principal. Deriva da estatística keyspace_misses no comando INFO. Contagem
CommandAuthorizationFailures O número total de tentativas falhadas por usuários para executar comandos que eles não têm permissão para chamar. É possível encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
CacheHitRate Indica a eficiência de uso da instância Valkey ou Redis OSS. Se a proporção de cache for inferior a aproximadamente 0,8, isso significa que uma quantidade significativa de chaves são despejadas, expiradas ou não existem. Isso é calculado usando as estatísticas cache_hits e cache_misses da seguinte maneira: cache_hits /(cache_hits + cache_misses). Percentual
ChannelAuthorizationFailures O número total de tentativas falhadas por usuários de acessar canais que eles não têm permissão para acessar. É possível encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme nesta métrica para detectar tentativas de acesso não autorizadas. Contagem
CurrConnections O número de conexões de clientes, excluindo conexões de réplicas de leitura. ElastiCache usa de 4 a 6 conexões para monitorar o cluster em cada caso. Deriva da estatística connected_clients no comando INFO. Contagem
CurrItems O número de itens no cache. Deriva da estatística keyspace, somando todas as chaves em todo o keyspace. Contagem
Dimension: Tier=Memory para clusters usando Hierarquização de dados em ElastiCache. O número de itens em memória. Contagem
Dimension: Tier=SSD (unidades de estado sólido) para clusters usando Hierarquização de dados em ElastiCache. O número de itens em SSD. Contagem
CurrVolatileItems Número total de chaves em todos os bancos de dados que têm um ttl definido. Deriva da estatística expires, somando todas as chaves com um ttl definido em todo o keyspace. Contagem
DatabaseCapacityUsagePercentage

Porcentagem da capacidade total de dados para o cluster que está em uso.

Em instâncias com camadas de dados, a métrica é calculada como (used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), onde used_memory e maxmemory são obtidas de INFO.

Em todos os outros casos, a métrica é calculada usando used_memory/maxmemory.

Percentual
DatabaseCapacityUsageCountedForEvictPercentage

Porcentagem da capacidade total de dados para o cluster que está em uso, excluindo a memória usada para sobrecarga e COB. Essa métrica é calculada como:

used_memory - mem_not_counted_for_evict/maxmemory

Em instâncias de dados em camadas, a métrica é calculada como:

(used_memory + SSD used) / (maxmemory + SSD total capacity)

onde used_memory e maxmemory são obtidos de INFO

Percentual
DatabaseMemoryUsagePercentage Porcentagem de memória para o cluster que está em uso. É calculado usando used_memory/maxmemory de INFO. Percentual
DatabaseMemoryUsageCountedForEvictPercentage Porcentagem de memória para o cluster que está em uso, excluindo a memória usada para sobrecarga e COB. É calculado usando used_memory-mem_not_counted_for_evict/maxmemory de INFO. Percentual
DB0AverageTTL Expõe o avg_ttl de DBO a partir da estatística keyspace do comando INFO. As réplicas não expiram as chaves; em vez disso, esperam que os nós primários expirem as chaves. Quando um nó primário expira uma chave (ou a remove por causa do LRU), ele sintetiza um DEL, que é transmitido para todas as réplicas. Assim sendo, DB0AverageTTL é 0 para nós de réplica, devido ao fato de que eles não expiram chaves e, portanto, não rastreiam TTL. Milissegundos
EngineCPUUtilization

Fornece utilização da CPU do thread do mecanismo Valkey ou Redis OSS. Como o Valkey e o Redis OSS são de thread único, você pode usar essa métrica para analisar a carga do próprio processo. A métrica EngineCPUUtilization fornece uma visibilidade mais precisa do processo. Você pode usá-la em conjunto com a métrica CPUUtilization. CPUUtilization expõe a utilização de CPU da instância do servidor como um todo, incluindo outros processos de sistema operacional e de gerenciamento. Para tipos de nós maiores com quatro v CPUs ou mais, use a EngineCPUUtilization métrica para monitorar e definir limites para escalabilidade.

nota

Em um ElastiCache host, os processos em segundo plano monitoram o host para fornecer uma experiência de banco de dados gerenciado. Esses processos em segundo plano podem ocupar uma parte significativa da workload da CPU. Isso não é significativo em hosts maiores com mais de dois CPUs v. Mas isso pode afetar hosts menores com 2v CPUs ou menos. Se você monitorar apenas a métrica EngineCPUUtilization, desconhecerá situações em que o host está sobrecarregado com alto uso da CPU do Valkey ou Redis OSS e alto uso da CPU dos processos de monitoramento em segundo plano. Portanto, recomendamos monitorar a CPUUtilization métrica para hosts com dois v CPUs ou menos.

Percentual
Evictions O número de chaves que foram removidas devido ao limite maxmemory. Deriva da estatística evicted_keys no comando INFO. Contagem
GlobalDatastoreReplicationLag Esse é o atraso entre o nó primário da região secundária e o nó primário da região primária. Para o Valkey ou Redis OSS habilitado para modo cluster, o atraso indica o atraso máximo entre os fragmentos. Segundos
IamAuthenticationExpirations O número total de conexões do Valkey ou Redis OSS expiradas autenticadas pelo IAM. Você pode encontrar mais informações sobre o Autenticação com o IAM no guia do usuário. Contagem
IamAuthenticationThrottling O número total de solicitações AUTH ou HELLO do Valkey ou Redis OSS com controle de utilização autenticadas pelo IAM. Você pode encontrar mais informações sobre o Autenticação com o IAM no guia do usuário. Contagem
IsMaster Indica se o nó é o nó primário do fragmento/cluster atual. A métrica pode ser 0 (não primária) ou 1 (primária). Contagem
KeyAuthorizationFailures O número total de tentativas falhadas por usuários de acessar chaves que eles não têm permissão para acessar. É possível encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizadas. Contagem
KeysTracked O número de chaves que estão sendo monitoradas pelo monitoramento de chaves do Valkey ou Redis OSS como um percentual de tracking-table-max-keys. O monitoramento de chaves é usado para ajudar o cache do lado do cliente e notifica os clientes quando as chaves são modificadas. Contagem
MemoryFragmentationRatio Indica a eficiência na alocação de memória do mecanismo Valkey ou Redis OSS. Certos limites significarão comportamentos diferentes. O valor recomendado é ter fragmentação acima de 1,0. É calculada com base em mem_fragmentation_ratio statistic do comando INFO. Número
NewConnections O número total de conexões que foram aceitas pelo servidor durante esse período. Deriva da estatística total_connections_received no comando INFO.
nota

Se você estiver usando o ElastiCache Redis OSS versão 5 ou inferior, entre duas e quatro das conexões relatadas por essa métrica serão usadas ElastiCache para monitorar o cluster. No entanto, ao usar o ElastiCache Redis OSS versão 6 ou superior, as conexões usadas ElastiCache para monitorar o cluster não são incluídas nessa métrica.

Contagem
NumItemsReadFromDisk O número total de itens recuperados do disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Contagem
NumItemsWrittenToDisk O número total de itens gravados no disco por minuto. Compatível somente para clusters usando Hierarquização de dados em ElastiCache. Contagem
MasterLinkHealthStatus Esse status tem dois valores: 0 ou 1. O valor 0 indica que os dados no nó ElastiCache primário não estão sincronizados com o Valkey ou o Redis OSS ativado. EC2 O valor de 1 indica que os dados não estão sincronizados. Para concluir a migração, use a operação CompleteMigrationda API. Booliano
Reclaimed O número total de eventos de expiração de chaves. Deriva da estatística expired_keys no comando INFO. Contagem
ReplicationBytes Para nós em uma configuração replicada, ReplicationBytes informa o número de bytes que a primária está enviando para todas as suas réplicas. Essa métrica é representante da carga de gravação no grupo de replicação. Deriva da estatística master_repl_offset no comando INFO. Bytes
ReplicationLag Essa métrica é aplicável somente para um nó de em execução como uma réplica de leitura. Ela representa o tempo decorrido, em segundos, até a réplica aplicar alterações do nó primário. Para Valkey 7.2 e versões posteriores e Redis OSS 5.0.6 em diante, o atraso pode ser medido em milissegundos. Segundos
SaveInProgress Essa métrica binária retorna 1 sempre que um salvamento de plano de fundo (com ou sem bifurcação) está em andamento e 0 caso não esteja. Um processo de salvamento de plano de fundo geralmente é usado durante snapshots e sincronizações. Essas operações podem prejudicar o desempenho. Usando a métrica SaveInProgress, você pode diagnosticar se uma performance prejudicada foi causada por um processo de salvamento de plano de fundo. Deriva da estatística rdb_bgsave_in_progress no comando INFO. Booliano
TrafficManagementActive Indica se, ElastiCache para Redis, o OSS está gerenciando ativamente o tráfego ajustando o tráfego alocado para comandos de entrada, monitoramento ou replicação. O tráfego é gerenciado quando mais comandos são enviados ao nó do que podem ser processados ​​pelo Valkey ou Redis OSS e é usado para manter a estabilidade e a operação ideal do mecanismo. Quaisquer pontos de dados de 1 podem indicar que o nó está subdimensionado para a workload que está sendo fornecida.
nota

Se essa métrica permanecer ativa, avalie o cluster para decidir se é necessário aumentar a escala verticalmente ou horizontalmente. As métricas relacionadas incluem NetworkBandwidthOutAllowanceExceeded e EngineCPUUtilization.

Booliano
SuccessfulWriteRequestLatency

Latência de solicitações de gravação bem-sucedidas.

Estatísticas válidas: média, soma, mínimo, máximo, contagem de amostras, qualquer percentil entre p0 e p100. A contagem de amostras inclui somente os comandos que foram executados com sucesso.

Microssegundos
SuccessfulReadRequestLatency

Latência de solicitações de leitura bem-sucedidas.

Estatísticas válidas: média, soma, mínimo, máximo, contagem de amostras, qualquer percentil entre p0 e p100. A contagem de amostras inclui somente os comandos que foram executados com sucesso.

Microssegundos
ErrorCount

O número total de comandos com falha durante o período especificado.

Estatísticas válidas: média, soma, mínimo, máximo

Contagem
CPUUtilization Disponibilidade do motor

AWS As regiões listadas a seguir estão disponíveis em todos os tipos de nós compatíveis.

Região Nome da região
us-east-2 Leste dos EUA (Ohio)
us-east-1 Leste dos EUA (Norte da Virgínia)
us-west-1 Oeste dos EUA (Norte da Califórnia)
us-west-2 Oeste dos EUA (Oregon)
ap-northeast-1 Ásia-Pacífico (Tóquio)
ap-northeast-2 Ásia-Pacífico (Seul)
ap-northeast-3 Asia Pacific (Osaka)
ap-east-1 Ásia-Pacífico (Hong Kong)
ap-south-1 Asia Pacific (Mumbai)
ap-southeast-1 Ásia-Pacífico (Singapura)
ap-southeast-2 Ásia-Pacífico (Sydney)
ap-southeast-3 Ásia-Pacífico (Jacarta)
ca-central-1 Canadá (Central)
cn-north-1 China (Pequim)
cn-northwest-2 China (Ningxia)
me-south-1 Oriente Médio (Bahrein)
eu-central-1 Europa (Frankfurt)
eu-west-1 Europa (Irlanda)
eu-west-2 Europa (Londres)
eu-west-3 UE (Paris)
eu-south-1 Europa (Milão)
af-south-1 África (Cidade do Cabo)
eu-north-1 Europa (Estocolmo)
sa-east-1 América do Sul (São Paulo)
us-gov-west-1 AWS GovCloud (Oeste dos EUA)
us-gov-east-1 AWS GovCloud (Leste dos EUA)

A seguir estão agregações de determinados tipos de comandos, derivados de info commandstats: A seção commandstats fornece estatísticas baseadas no tipo de comando, incluindo o número de chamadas, o tempo total de CPU consumido por esses comandos e a CPU média consumida por execução de comando. Para cada tipo de comando, é adicionada a seguinte linha: cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX.

As métricas de latência listadas a seguir são calculadas com a estatística commandstats de INFO. Elas são calculadas da seguinte maneira: delta(usec)/delta(calls). O delta é calculado como a diferença dentro de um minuto. A latência é definida como o tempo gasto pela CPU ElastiCache para processar o comando. Observe que, para clusters que usam classificação de dados por nível, o tempo necessário para buscar itens no SSD não está incluído nessas medições.

Para obter uma lista completa dos comandos disponíveis, consulte comandos na documentação do Valkey.

Métrica Descrição Unidade
ClusterBasedCmds O número total de comandos que são baseados em cluster. Deriva da estatística commandstats, somando todos os comandos que atuam em um cluster (cluster slot, cluster info etc.). Contagem
ClusterBasedCmdsLatency Latência de comandos baseados em cluster. Microssegundos
EvalBasedCmds O número total de comandos para comandos baseados em avaliação. É derivado da estatística commandstats, pela soma de eval, evalsha. Contagem
EvalBasedCmdsLatency Latência de comandos baseados em avaliação. Microssegundos
GeoSpatialBasedCmds O número total de comandos para comandos baseados em dados geoespaciais. É derivado da estatística commandstats. Ele é derivado somando todos o tipos de comandos geo: geoadd, geodist, geohash, geopos, georadius, e georadiusbymember. Contagem
GeoSpatialBasedCmdsLatency Latência de comandos baseados em dados geoespaciais. Microssegundos
GetTypeCmds O número total de comandos do tipo read-only. É derivado da estatística commandstats, somando todos os comandos do tipo read-only (get, hget, scard, lrange, etc.) Contagem
GetTypeCmdsLatency Latência de comandos de leitura. Microssegundos
HashBasedCmds O número total de comandos baseados em hash. É derivado da estatística commandstats, somando todos os comandos que atuam em um ou mais hashes (hget, hkeys, hvals, hdel, etc.). Contagem
HashBasedCmdsLatency Latência de comandos baseados em hash. Microssegundos
HyperLogLogBasedCmds O número total de comandos baseados em HyperLogLog. É derivado da estatística commandstats, somando todos os comandos do tipo pf (pfadd, pfcount, pfmerge, etc.). Contagem
HyperLogLogBasedCmdsLatency Latência dos comandos HyperLogLog baseados. Microssegundos
JsonBasedCmds O número total de comandos JSON, incluindo comandos de leitura e gravação. É derivado da estatística commandstats, somando todos os comandos JSON que atuam em chaves JSON. Contagem
JsonBasedCmdsLatency Latência de todos os comandos JSON, incluindo comandos de leitura e gravação. Microssegundos
JsonBasedGetCmds O número total de comandos JSON somente leitura. É derivado da estatística commandstats, somando todos os comandos de leitura JSON que atuam em chaves JSON. Contagem
JsonBasedGetCmdsLatency Latência dos comandos JSON somente leitura. Microssegundos
JsonBasedSetCmds O número total de comandos de gravação JSON. É derivado da estatística commandstats, somando todos os comandos de gravação JSON que atuam em chaves JSON. Contagem
JsonBasedSetCmdsLatency Latência dos comandos de gravação JSON. Microssegundos
KeyBasedCmds O número total de comandos baseados em chave. É derivado da estatística commandstats, somando todos os comandos que atuam em uma ou mais chaves em várias estruturas de dados (del, expire, rename, etc.). Contagem
KeyBasedCmdsLatency Latência de comandos baseados em chave. Microssegundos
ListBasedCmds O número total de comandos baseados em lista. É derivado da estatística commandstats, somando todos os comandos que atuam em uma ou mais listas (lindex, lrange, lpush, ltrim, etc.). Contagem
ListBasedCmdsLatency Latência de comandos baseados em lista. Microssegundos
NonKeyTypeCmds O número total de comandos não baseados em chave. É derivado da estatística commandstats, somando todos os comandos que não atuam em uma chave; por exemplo, acl, dbsize ou info. Contagem
NonKeyTypeCmdsLatency Latência dos non-key-based comandos. Microssegundos
PubSubBasedCmds O número total de comandos para a funcionalidade pub/sub. É derivado das estatísticas commandstats, somando todos os comandos usados para a funcionalidade pub/sub: psubscribe, publish, pubsub, punsubscribe, ssubscribe, sunsubscribe, spublish, subscribe e unsubscribe. Contagem
PubSubBasedCmdsLatency Latência de comandos baseados em pub/sub. Microssegundos
SetBasedCmds O número total de comandos que são baseados em conjuntos. É derivado da estatística commandstats, somando todos os comandos que atuam em um ou mais conjuntos (scard, sdiff, sadd, sunion, etc.). Contagem
SetBasedCmdsLatency Latência de comandos baseados em conjunto. Microssegundos
SetTypeCmds O número total de tipos de comando write. É derivado da estatística commandstats, somando todos os tipos de comando mutative que operam em dados (set, hset, sadd, lpop, etc.) Contagem
SetTypeCmdsLatency Latência de comandos de gravação. Microssegundos
SortedSetBasedCmds O número total de comandos que são classificados com base em conjuntos. É derivado da estatística commandstats, somando todos os comandos que atuam em um ou mais conjuntos classificados (zcount, zrange, zrank, zadd, etc.). Contagem
SortedSetBasedCmdsLatency Latência de comandos baseados em classificação. Microssegundos
StringBasedCmds O número total de comandos baseados em string. É derivado da estatística commandstats, somando todos os comandos que atuam em uma ou mais strings (strlen, setex, setrange, etc.). Contagem
StringBasedCmdsLatency Latência de comandos baseados em string. Microssegundos
StreamBasedCmds O número total de comandos que são baseados em fluxo. É derivado da estatística commandstats, somando todos os comandos que atuam em um ou mais tipos de dados de fluxos (xrange, xlen, xadd, xdel, etc.). Contagem
StreamBasedCmdsLatency Latência de comandos baseados em fluxo. Microssegundos