Métricas de Valkey y Redis OSS - Amazon ElastiCache

Métricas de Valkey y Redis OSS

El espacio de nombres Amazon ElastiCache incluye las siguientes métricas de Valkey y Redis OSS. Estas métricas son las mismas cuando se utiliza el motor de Valkey.

Con la excepción de ReplicationLag, EngineCPUUtilization, SuccessfulWriteRequestLatency y SuccessfulReadRequestLatency, estas métricas se obtienen del comando info. Cada métrica se calcula en el nivel de nodo de caché.

Para ver documentación completa del comando info, consulte http://valkey.io/commands/info.

Véase también

Métrica Descripción Unidad
ActiveDefragHits El número de reasignaciones de valor por minuto que ha realizado el proceso de desfragmentación activo. Se obtiene de la estadística de active_defrag_hits en INFO. Número
AuthenticationFailures Número total de intentos fallidos de autenticarse en Valkey o Redis OSS mediante el comando AUTH. Puede encontrar más información sobre los errores de autenticación individuales mediante el comando ACL LOG. Sugerimos configurar una alarma para detectar intentos de acceso sin autorización. Recuento
BytesUsedForCache Número total de bytes asignados por Valkey o Redis OSS para todos los propósitos, incluido los conjuntos de datos, los búferes, etc. Bytes
Dimension: Tier=Memory para clústeres de Valkey o Redis OSS mediante Organización de datos en niveles en ElastiCache: número total de bytes utilizados para la caché por memoria. Este es el valor de la estadística de used_memory en INFO. Bytes
Dimension: Tier=SSD para clústeres de Valkey o Redis OSS mediante Organización de datos en niveles en ElastiCache: número total de bytes utilizados para la caché por SSD. Bytes
BytesReadFromDisk Número total de bytes leídos del disco por minuto. Compatible solo con clústeres que utilizan Organización de datos en niveles en ElastiCache. Bytes
BytesWrittenToDisk Número total de bytes escritos en el disco por minuto. Compatible solo con clústeres que utilizan Organización de datos en niveles en ElastiCache. Bytes
CacheHits El número de búsquedas de claves solo de lectura realizadas correctamente en el diccionario principal. Se obtiene de la estadística de keyspace_hits en INFO. Recuento
CacheMisses El número de búsquedas de claves solo de lectura que no se realizaron correctamente en el diccionario principal. Se obtiene de la estadística de keyspace_misses en INFO. Recuento
CommandAuthorizationFailures Número total de intentos fallidos de los usuarios de ejecutar comandos a los que no tienen permiso para llamar. Puede encontrar más información sobre los errores de autenticación individuales mediante el comando ACL LOG. Sugerimos configurar una alarma para detectar intentos de acceso sin autorización. Recuento
CacheHitRate Indica la eficiencia de uso de la instancia de Valkey o Redis OSS. Si la relación de caché es inferior a aproximadamente 0,8, significa que una cantidad significativa de claves se han expulsado, han caducado o no existen. Esto se calcula utilizando estadísticas cache_hits y cache_misses de la siguiente manera: cache_hits /(cache_hits + cache_misses). Porcentaje
ChannelAuthorizationFailures El número total de intentos con error de los usuarios de acceder a canales a los que no tienen permiso para acceder. Puede encontrar más información sobre los errores de autenticación individuales mediante el comando ACL LOG. Sugerimos configurar una alarma en esta métrica para detectar intentos de acceso sin autorización. Recuento
CurrConnections Número de conexiones de cliente, excluido las conexiones de réplicas de lectura. ElastiCache utiliza de 4 a 6 de las conexiones para supervisar el clúster en cada caso. Se obtiene de la estadística de connected_clients en INFO. Recuento
CurrItems El número de elementos en la caché. Se obtiene de la estadística de keyspace, sumando todas las claves del espacio de claves completo. Recuento
Dimension: Tier=Memory para clústeres que utilizan Organización de datos en niveles en ElastiCache. Número de elementos en la memoria. Recuento
Dimension: Tier=SSD (unidades de estado sólido) para clústeres que utilizan Organización de datos en niveles en ElastiCache. Número de elementos en SSD. Recuento
CurrVolatileItems Número total de claves en todas las bases de datos que tienen un conjunto ttl. Se obtiene de la estadística de expires, sumando todas las claves con un conjunto ttl en el espacio de claves completo. Recuento
DatabaseCapacityUsagePercentage

El porcentaje de la capacidad de datos total para el clúster que está en uso.

En las instancias con niveles de datos, la métrica se calcula como (used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), donde used_memory y maxmemory se toman de INFO.

En el resto de los casos, la métrica se calcula utilizando used_memory/maxmemory.

Porcentaje
DatabaseCapacityUsageCountedForEvictPercentage

El porcentaje de la capacidad de datos total para el clúster que está en uso, excluida la memoria utilizada para gastos generales y COB. Esta métrica se calcula de la siguiente manera:

used_memory - mem_not_counted_for_evict/maxmemory

En las instancias de datos por niveles, la métrica se calcula de la siguiente manera:

(used_memory + SSD used) / (maxmemory + SSD total capacity)

donde used_memory y maxmemory se toman de INFO

Porcentaje
DatabaseMemoryUsagePercentage El porcentaje de la memoria para el clúster que está en uso. Esto se calcula usando used_memory/maxmemory de INFO. Porcentaje
DatabaseMemoryUsageCountedForEvictPercentage El porcentaje de la memoria para el clúster que está en uso, excluida la memoria utilizada para gastos generales y COB. Esto se calcula usando used_memory-mem_not_counted_for_evict/maxmemory de INFO. Porcentaje
DB0AverageTTL Expone avg_ttl de DBO a partir de la estadística de keyspace del comando INFO. Las réplicas no hacen que venzan las claves, sino que esperan a que los nodos principales hagan que venzan las claves. Cuando un nodo principal hace que una clave venza (o la expulsa debido a LRU), sintetiza un comando DEL, que se transmite a todas las réplicas. Por lo tanto, DB0AverageTTL es 0 para los nodos de réplica, debido al hecho de que no vencen las claves y, por lo tanto, no realizan un seguimiento de TTL. Milisegundos
EngineCPUUtilization

Proporciona el uso de la CPU del subproceso del motor de Valkey o Redis OSS. Como Valkey y Redis OSS utilizan un solo subproceso, puede utilizar esta métrica para analizar la carga del propio proceso. La métrica EngineCPUUtilization brinda una visibilidad más precisa del proceso. Puede utilizarla junto con la métrica CPUUtilization. CPUUtilization muestra el uso de la CPU para la instancia de servidor como un conjunto, lo que incluye otro sistema operativo y los procesos de administración. En los tipos de nodos grandes que tienen cuatro o más vCPU, utilice la métrica EngineCPUUtilization para monitorear y establecer umbrales de escalado.

nota

En un host de ElastiCache existen procesos en segundo plano que monitorean el host para proporcionar una experiencia de base de datos administrada. Estos procesos en segundo plano pueden ocupar una parte importante de la carga de trabajo de la CPU. Esto no es significativo en host más grandes con más de 2 vCPU. Pero puede afectar a hosts más pequeños con 2 vCPU o menos. Si solo supervisa la métrica EngineCPUUtilization, no tendrá constancia de las situaciones en las que el host esté sobrecargado con un alto uso de CPU de Valkey o Redis OSS y un alto uso de CPU de los procesos de supervisión en segundo plano. Por lo tanto, recomendamos monitorear la métrica CPUUtilization en los hosts con 2 vCPU o menos.

Porcentaje
Evictions El número de claves que se han desalojado debido al límite maxmemory. Se obtiene de la estadística de evicted_keys en INFO. Recuento
GlobalDatastoreReplicationLag Es el retraso entre el nodo primario de la región secundaria y el nodo primario de la región principal. Para Valkey o Redis OSS en modo de clúster habilitado, el retraso indica el retardo máximo entre las particiones. Segundos
IamAuthenticationExpirations El número total de conexiones de Valkey o Redis OSS autenticadas por IAM que han caducado. Puede encontrar más información sobre Autenticación con IAM en la guía del usuario. Recuento
IamAuthenticationThrottling El número total de solicitudes AUTH o HELLO de Valkey o Redis OSS autenticadas por IAM con limitación. Puede encontrar más información sobre Autenticación con IAM en la guía del usuario. Recuento
IsMaster Indica si el nodo es el nodo primario de la partición o clúster actual. La métrica puede ser 0 (no principal) o 1 (principal). Recuento
KeyAuthorizationFailures Número total de intentos fallidos de los usuarios de acceder a claves a las que no tienen permiso para acceder. Puede encontrar más información sobre los errores de autenticación individuales mediante el comando ACL LOG. Sugerimos configurar una alarma para detectar intentos de acceso sin autorización. Recuento
KeysTracked Número de claves a las que Valkey o Redis OSS realiza un seguimiento como un porcentaje de tracking-table-max-keys. El seguimiento de claves se utiliza para ayudar al almacenamiento en caché del lado del cliente y notifica a los clientes cuando se modifican las claves. Recuento
MemoryFragmentationRatio Indica la eficiencia en la asignación de memoria del motor de Valkey o Redis OSS. Determinados umbrales supondrán comportamientos diferentes. El valor recomendado es tener fragmentación por encima de 1,0. Esto se calcula a partir de mem_fragmentation_ratio statistic de INFO. Número
NewConnections El número total de conexiones que ha aceptado el servidor durante este periodo. Se obtiene de la estadística de total_connections_received en INFO.
nota

Si utiliza ElastiCache para Redis OSS versión 5 o inferior, ElastiCache utiliza entre dos y cuatro de las conexiones notificadas por esta métrica para supervisar el clúster. Sin embargo, cuando se utiliza ElastiCache para Redis OSS versión 6 o superior, las conexiones utilizadas por ElastiCache para supervisar el clúster no se incluyen en esta métrica.

Recuento
NumItemsReadFromDisk El número total de elementos recuperados del disco por minuto. Compatible solo con clústeres que utilizan Organización de datos en niveles en ElastiCache. Recuento
NumItemsWrittenToDisk El número total de elementos escritos en disco por minuto. Compatible solo con clústeres que utilizan Organización de datos en niveles en ElastiCache. Recuento
MasterLinkHealthStatus Este estado tiene dos valores: 0 o 1. El valor 0 indica que los datos del nodo principal de ElastiCache no se encuentran sincronizados con Valkey o Redis OSS en EC2. El valor 1 indica que los datos están sincronizados. Para completar la migración, utilice la operación de la API CompleteMigration. Booleano
Reclaimed El número total de eventos de vencimiento de clave. Se obtiene de la estadística de expired_keys en INFO. Recuento
ReplicationBytes Para los nodos en una configuración que se replica, ReplicationBytes indica el número de bytes que el nodo primario envía a todas las réplicas. Esta métrica representa la carga de escritura del grupo de reproducción. Se obtiene de la estadística de master_repl_offset en INFO. Bytes
ReplicationLag Esta métrica solo se aplica a un nodo que se ejecuta como una réplica de lectura. Representa lo que tarda la réplica en aplicar los cambios del nodo principal, en segundos. Desde Valkey 7.2 en adelante y el motor de Redis OSS versión 5.0.6 en adelante, el retraso puede medirse en milisegundos. Segundos
SaveInProgress Esta métrica binaria devuelve 1 cuando hay una operación de guardado en segundo plano en curso (con ramificación o sin ella) y 0 en caso contrario. El proceso de guardado en segundo plano se usa normalmente durante las instantáneas y las sincronizaciones. Estas operaciones pueden mermar el rendimiento. Con la métrica SaveInProgress, puede diagnosticar si un proceso de guardado en segundo plano causó o no una merma del rendimiento. Se obtiene de la estadística de rdb_bgsave_in_progress en INFO. Booleano
TrafficManagementActive Indica si ElastiCache para Redis OSS administra el tráfico de forma activa ajustando el tráfico asignado a los comandos entrantes, la supervisión o la replicación. El tráfico se administra cuando se envían más comandos al nodo de los que Valkey o Redis OSS pueden procesar y se utiliza para mantener la estabilidad y el funcionamiento óptimo del motor. Cualquier punto de datos de 1 puede indicar que ha disminuido la escala del nodo para la carga de trabajo que se proporciona.
nota

Si esta métrica permanece activa, evalúe el clúster para decidir si es necesario escalar verticalmente o escalar horizontalmente. Las métricas relacionadas incluyen NetworkBandwidthOutAllowanceExceeded y EngineCPUUtilization.

Booleano
SuccessfulWriteRequestLatency

Latencia de las solicitudes de escritura correctas.

Estadísticas válidas: Average, Sum, Min, Max, Sample Count y cualquier percentil entre p0 y p100. El recuento de muestras solo incluye los comandos que se han ejecutado correctamente.

Microsegundos
SuccessfulReadRequestLatency

Latencia de las solicitudes de lectura correctas.

Estadísticas válidas: Average, Sum, Min, Max, Sample Count y cualquier percentil entre p0 y p100. El recuento de muestras solo incluye los comandos que se han ejecutado correctamente.

Microsegundos
ErrorCount

Número total de comandos fallidos durante el periodo de tiempo especificado.

Estadísticas válidas: Average, Sum, Min y Max

Recuento
SearchNumberOfIndexes

Número de índices creados

Recuento
SearchTotalIndexedDocuments

Número total de claves en todos los índices

Recuento
SearchUsedMemoryBytes

Número de bytes de memoria consumidos en todas las estructuras de datos de búsqueda

Bytes
Disponibilidad de EngineCPUUtilization

AWSLas regiones de que se indican a continuación se encuentran disponibles en todos los tipos de nodos admitidos.

Región Nombre de la región
us-east-2 Este de EE. UU. (Ohio)
us-east-1 Este de EE. UU. (Norte de Virginia)
us-west-1 Oeste de EE. UU. (Norte de California)
us-west-2 Oeste de EE. UU. (Oregón)
ap-northeast-1 Asia-Pacífico (Tokio)
ap-northeast-2 Asia-Pacífico (Seúl)
ap-northeast-3 Asia-Pacífico (Osaka)
ap-east-1 Asia-Pacífico (Hong Kong)
ap-south-1 Asia-Pacífico (Mumbai)
ap-southeast-1 Asia-Pacífico (Singapur)
ap-southeast-2 Asia-Pacífico (Sídney)
ap-southeast-3 Asia-Pacífico (Yakarta)
ca-central-1 Canadá (centro)
cn-north-1 China (Pekín)
cn-northwest-2 China (Ningxia)
me-south-1 Medio Oriente (Baréin)
eu-central-1 Europa (Fráncfort)
eu-west-1 Europa (Irlanda)
eu-west-2 Europa (Londres)
eu-west-3 UE (París)
eu-south-1 Europa (Milán)
af-south-1 África (Ciudad del Cabo)
eu-north-1 Europa (Estocolmo)
sa-east-1 América del Sur (São Paulo)
us-gov-west-1 AWS GovCloud (EE. UU. Oeste)
us-gov-east-1 AWS GovCloud (Este de EE. UU.)

A continuación se muestran agrupaciones de determinados tipos de comandos, que se obtienen de : info commandstats. La sección commandstats proporciona estadísticas basadas en el tipo de comando, incluido el número de llamadas, el tiempo total de CPU consumido por estos comandos y el promedio de CPU consumido por ejecución de comando. Para cada tipo de comando, se agrega la siguiente línea: cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX.

Las métricas de latencia que se indican a continuación se calculan con la estadística de commandstats de INFO. Se calculan de la siguiente manera: delta(usec)/delta(calls). delta se calcula como la diferencia en un minuto. La latencia se define como el tiempo de CPU que ElastiCache tarda en procesar el comando. Tenga en cuenta que para los clústeres que utilizan la organización de datos en niveles, el tiempo que tarda en obtener elementos de SSD no se incluye en estas mediciones.

Para obtener una lista completa de los comandos disponibles, consulte los comandos en la documentación de Valkey.

Métrica Descripción Unidad
ClusterBasedCmds El número total de comandos basados en clústeres. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en un clúster (cluster slot, cluster info, etc.). Recuento
ClusterBasedCmdsLatency Latencia de comandos basados en clústeres. Microsegundos
EvalBasedCmds El número total de comandos para los comandos basados en eval. Se obtiene de la estadística de commandstats sumando eval, evalsha. Recuento
EvalBasedCmdsLatency Latencia de comandos basados en eval. Microsegundos
GeoSpatialBasedCmds Número total de comandos para comandos basados en condiciones geoespaciales. Esto se obtiene de la estadística de commandstats. Esto se obtiene al sumar todos los tipos de comandos geográficos: geoadd, geodist, geohash, geopos, georadius y georadiusbymember. Recuento
GeoSpatialBasedCmdsLatency Latencia de comandos basados en condiciones geoespaciales. Microsegundos
GetTypeCmds El número total de comandos de escritura de read-only. Se obtiene de la estadística de commandstats sumando todos los tipos de comandos read-only (get, hget, scard, lrange, etc.). Recuento
GetTypeCmdsLatency Latencia de los comandos de lectura. Microsegundos
HashBasedCmds El número total de comandos basados en hash. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en uno o más algoritmos hash (hget, hkeys, hvals, hdel, etc.). Recuento
HashBasedCmdsLatency Latencia de comandos basados en hash. Microsegundos
HyperLogLogBasedCmds El número total de comandos basados en HyperLogLog. Se obtiene de la estadística de commandstats sumando todos los tipos de comandos pf (pfadd, pfcount, pfmerge, etc.). Recuento
HyperLogLogBasedCmdsLatency Latencia de los comandos basados en HyperLogLog. Microsegundos
JsonBasedCmds El número total de comandos JSON, incluidos los comandos de lectura y escritura. Se obtiene de la estadística de commandstats sumando todos los comandos de JSON que actúan sobre claves de JSON. Recuento
JsonBasedCmdsLatency Latencia de todos los comandos JSON, incluidos los comandos de lectura y escritura. Microsegundos
JsonBasedGetCmds Número total de comandos de solo lectura de JSON. Se obtiene de la estadística de commandstats sumando todos los comandos de lectura de JSON que actúan sobre claves de JSON. Recuento
JsonBasedGetCmdsLatency Latencia de los comandos de solo lectura de JSON. Microsegundos
JsonBasedSetCmds Número total de comandos de escritura de JSON. Se obtiene de la estadística de commandstats sumando todos los comandos de escritura de JSON que actúan sobre claves de JSON. Recuento
JsonBasedSetCmdsLatency Latencia de los comandos de escritura de JSON. Microsegundos
KeyBasedCmds El número total de comandos basados en claves. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en una o más claves en varias estructuras de datos (del, expire, rename, etc.). Recuento
KeyBasedCmdsLatency Latencia de comandos basados en claves. Microsegundos
ListBasedCmds El número total de comandos basados en listas. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en una o más listas (lindex, lrange, lpush, ltrim, etc.). Recuento
ListBasedCmdsLatency Latencia de comandos basados en listas. Microsegundos
NonKeyTypeCmds Número total de comandos no basados en claves. Se obtiene de la estadística de commandstats sumando todos los comandos que no actúan sobre una clave, por ejemplo, acldbsize o info. Recuento
NonKeyTypeCmdsLatency Latencia de los comandos no basados en claves. Microsegundos
PubSubBasedCmds El número total de comandos para la funcionalidad publicación/suscripción. Se obtiene de la estadística de commandstats sumando todos los comandos utilizados para la funcionalidad de publicación/suscripción: psubscribe, publish, pubsub, punsubscribe, ssubscribe, sunsubscribe, spublish, subscribe y unsubscribe. Recuento
PubSubBasedCmdsLatency Latencia de comandos basados en publicación/suscripción. Microsegundos
SetBasedCmds El número total de comandos basados en instrucciones set. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en uno o más conjuntos (scard, sdiff, sadd, sunion, etc.). Recuento
SetBasedCmdsLatency Latencia de comandos basados en conjuntos. Microsegundos
SetTypeCmds El número total de tipos de comandos de write. Se obtiene de la estadística de commandstats sumando todos los tipos de comandos mutative que actúan en los datos (set, hset. sadd, lpop, etc.). Recuento
SetTypeCmdsLatency Latencia de comandos de escritura. Microsegundos
SortedSetBasedCmds El número total de comandos basados en instrucciones set ordenadas. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en uno o más conjuntos ordenados (zcount, zrange, zrank, zadd, etc.). Recuento
SortedSetBasedCmdsLatency Latencia de comandos basados en orden. Microsegundos
StringBasedCmds El número total de comandos basados en cadenas. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en una o más cadenas (strlen, setex, setrange, etc.). Recuento
StringBasedCmdsLatency Latencia de comandos basados en cadenas Microsegundos
StreamBasedCmds El número total de comandos basados en secuencias. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en uno o más tipos de datos de flujo (xrange, xlen, xadd, xdel, etc.). Recuento
StreamBasedCmdsLatency Latencia de comandos basados en secuencias. Microsegundos
SearchBasedCmds Número total de comandos Search, incluidos los comandos de lectura y escritura. Se obtiene de la estadística commandstats mediante la suma de todos los comandos Search. Recuento
SearchBasedCmdsLatency Latencia de todos los comandos Search, incluidos los comandos de lectura y escritura. Microsegundos
SearchBasedGetCmds Número total de comandos de solo lectura Search. Se obtiene de la estadística commandstats mediante la suma de todos los comandos de lectura Search. Recuento
SearchBasedGetCmdsLatency Latencia de los comandos de solo lectura Search. Microsegundos
SearchBasedSetCmds Número total de comandos de escritura Search. Se obtiene de la estadística commandstats mediante la suma de todos los comandos de escritura Search. Recuento
SearchBasedSetCmdsLatency Latencia de los comandos de escritura Search. Microsegundos