Métricas de Valkey y Redis OSS - Amazon ElastiCache

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Métricas de Valkey y Redis OSS

El espacio de nombres Amazon ElastiCache incluye las siguientes métricas de Valkey y Redis OSS. Estas métricas son las mismas cuando se utiliza el motor de Valkey.

Con la excepción de ReplicationLagEngineCPUUtilization,SuccessfulWriteRequestLatency, ySuccessfulReadRequestLatency, estas métricas se derivan del info comando. Cada métrica se calcula en el nivel de nodo de caché.

Para obtener la documentación completa del info comando, consulte http://valkey. io/commands/info.

Véase también

Métrica Descripción Unidad
ActiveDefragHits El número de reasignaciones de valor por minuto que ha realizado el proceso de desfragmentación activo. Se obtiene de la estadística de active_defrag_hits en INFO. Número
AuthenticationFailures Número total de intentos fallidos de autenticarse en Valkey o Redis OSS mediante el comando AUTH. Puede encontrar más información sobre los errores de autenticación individuales mediante el comando ACL LOG. Sugerimos configurar una alarma para detectar intentos de acceso sin autorización. Recuento
BytesUsedForCache Número total de bytes asignados por Valkey o Redis OSS para todos los propósitos, incluido los conjuntos de datos, los búferes, etc. Bytes
Dimension: Tier=Memory para clústeres de Valkey o Redis OSS mediante Organización de datos por niveles en ElastiCache: número total de bytes utilizados para la caché por memoria. Este es el valor de la estadística de used_memory en INFO. Bytes
Dimension: Tier=SSD para clústeres de Valkey o Redis OSS mediante Organización de datos por niveles en ElastiCache: número total de bytes utilizados para la caché por SSD. Bytes
BytesReadFromDisk Número total de bytes leídos del disco por minuto. Compatible solo con clústeres que utilizan Organización de datos por niveles en ElastiCache. Bytes
BytesWrittenToDisk Número total de bytes escritos en el disco por minuto. Compatible solo con clústeres que utilizan Organización de datos por niveles en ElastiCache. Bytes
CacheHits El número de búsquedas de claves solo de lectura realizadas correctamente en el diccionario principal. Se obtiene de la estadística de keyspace_hits en INFO. Recuento
CacheMisses El número de búsquedas de claves solo de lectura que no se realizaron correctamente en el diccionario principal. Se obtiene de la estadística de keyspace_misses en INFO. Recuento
CommandAuthorizationFailures Número total de intentos fallidos de los usuarios de ejecutar comandos a los que no tienen permiso para llamar. Puede encontrar más información sobre los errores de autenticación individuales mediante el comando ACL LOG. Sugerimos configurar una alarma para detectar intentos de acceso sin autorización. Recuento
CacheHitRate Indica la eficiencia de uso de la instancia de Valkey o Redis OSS. Si la relación de caché es inferior a aproximadamente 0,8, significa que una cantidad significativa de claves se han expulsado, han caducado o no existen. Esto se calcula utilizando estadísticas cache_hits y cache_misses de la siguiente manera: cache_hits /(cache_hits + cache_misses). Porcentaje
ChannelAuthorizationFailures El número total de intentos con error de los usuarios de acceder a canales a los que no tienen permiso para acceder. Puede encontrar más información sobre los errores de autenticación individuales mediante el comando ACL LOG. Sugerimos configurar una alarma en esta métrica para detectar intentos de acceso sin autorización. Recuento
CurrConnections El número de conexiones de clientes, excluidas las conexiones de las réplicas de lectura. ElastiCache utiliza de 4 a 6 de las conexiones para supervisar el clúster en cada caso. Se obtiene de la estadística de connected_clients en INFO. Recuento
CurrItems El número de elementos en la caché. Se obtiene de la estadística de keyspace, sumando todas las claves del espacio de claves completo. Recuento
Dimension: Tier=Memory para clústeres que utilizan Organización de datos por niveles en ElastiCache. Número de elementos en la memoria. Recuento
Dimension: Tier=SSD (unidades de estado sólido) para clústeres que utilizan Organización de datos por niveles en ElastiCache. Número de elementos en SSD. Recuento
CurrVolatileItems Número total de claves en todas las bases de datos que tienen un conjunto ttl. Se obtiene de la estadística de expires, sumando todas las claves con un conjunto ttl en el espacio de claves completo. Recuento
DatabaseCapacityUsagePercentage

El porcentaje de la capacidad de datos total para el clúster que está en uso.

En las instancias con niveles de datos, la métrica se calcula como (used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), donde used_memory y maxmemory se toman de INFO.

En el resto de los casos, la métrica se calcula utilizando used_memory/maxmemory.

Porcentaje
DatabaseCapacityUsageCountedForEvictPercentage

El porcentaje de la capacidad de datos total para el clúster que está en uso, excluida la memoria utilizada para gastos generales y COB. Esta métrica se calcula de la siguiente manera:

used_memory - mem_not_counted_for_evict/maxmemory

En las instancias de datos por niveles, la métrica se calcula de la siguiente manera:

(used_memory + SSD used) / (maxmemory + SSD total capacity)

donde used_memory y maxmemory se toman de INFO

Porcentaje
DatabaseMemoryUsagePercentage El porcentaje de la memoria para el clúster que está en uso. Esto se calcula usando used_memory/maxmemory de INFO. Porcentaje
DatabaseMemoryUsageCountedForEvictPercentage El porcentaje de la memoria para el clúster que está en uso, excluida la memoria utilizada para gastos generales y COB. Esto se calcula usando used_memory-mem_not_counted_for_evict/maxmemory de INFO. Porcentaje
DB0AverageTTL Expone avg_ttl de DBO a partir de la estadística de keyspace del comando INFO. Las réplicas no hacen que venzan las claves, sino que esperan a que los nodos principales hagan que venzan las claves. Cuando un nodo principal hace que una clave venza (o la expulsa debido a LRU), sintetiza un comando DEL, que se transmite a todas las réplicas. Por lo tanto, DB0AverageTTL es 0 para los nodos de réplica, debido al hecho de que no vencen las claves y, por lo tanto, no realizan un seguimiento de TTL. Milisegundos
EngineCPUUtilization

Proporciona el uso de la CPU del subproceso del motor de Valkey o Redis OSS. Como Valkey y Redis OSS utilizan un solo subproceso, puede utilizar esta métrica para analizar la carga del propio proceso. La métrica EngineCPUUtilization brinda una visibilidad más precisa del proceso. Puede utilizarla junto con la métrica CPUUtilization. CPUUtilization muestra el uso de la CPU para la instancia de servidor como un conjunto, lo que incluye otro sistema operativo y los procesos de administración. Para tipos de nodos más grandes con cuatro v CPUs o más, utilice la EngineCPUUtilization métrica para supervisar y establecer los umbrales de escalado.

nota

En un ElastiCache host, los procesos en segundo plano supervisan el host para proporcionar una experiencia de base de datos gestionada. Estos procesos en segundo plano pueden ocupar una parte importante de la carga de trabajo de la CPU. Esto no es significativo en los hosts más grandes con más de dos vCPUs. Sin embargo, puede afectar a los hosts más pequeños con 2 versiones CPUs o menos. Si solo supervisa la métrica EngineCPUUtilization, no tendrá constancia de las situaciones en las que el host esté sobrecargado con un alto uso de CPU de Valkey o Redis OSS y un alto uso de CPU de los procesos de supervisión en segundo plano. Por lo tanto, recomendamos monitorear la CPUUtilization métrica para los hosts con dos v CPUs o menos.

Porcentaje
Evictions El número de claves que se han desalojado debido al límite maxmemory. Se obtiene de la estadística de evicted_keys en INFO. Recuento
GlobalDatastoreReplicationLag Es el retraso entre el nodo primario de la región secundaria y el nodo primario de la región principal. Para Valkey o Redis OSS en modo de clúster habilitado, el retraso indica el retardo máximo entre las particiones. Segundos
IamAuthenticationExpirations El número total de conexiones de Valkey o Redis OSS autenticadas por IAM que han caducado. Puede encontrar más información sobre Autenticación con IAM en la guía del usuario. Recuento
IamAuthenticationThrottling El número total de solicitudes AUTH o HELLO de Valkey o Redis OSS autenticadas por IAM con limitación. Puede encontrar más información sobre Autenticación con IAM en la guía del usuario. Recuento
IsMaster Indica si el nodo es el nodo primario de la partición o clúster actual. La métrica puede ser 0 (no principal) o 1 (principal). Recuento
KeyAuthorizationFailures Número total de intentos fallidos de los usuarios de acceder a claves a las que no tienen permiso para acceder. Puede encontrar más información sobre los errores de autenticación individuales mediante el comando ACL LOG. Sugerimos configurar una alarma para detectar intentos de acceso sin autorización. Recuento
KeysTracked Número de claves a las que Valkey o Redis OSS realiza un seguimiento como un porcentaje de tracking-table-max-keys. El seguimiento de claves se utiliza para ayudar al almacenamiento en caché del lado del cliente y notifica a los clientes cuando se modifican las claves. Recuento
MemoryFragmentationRatio Indica la eficiencia en la asignación de memoria del motor de Valkey o Redis OSS. Determinados umbrales supondrán comportamientos diferentes. El valor recomendado es tener fragmentación por encima de 1,0. Esto se calcula a partir del mem_fragmentation_ratio statistic de INFO. Número
NewConnections El número total de conexiones que ha aceptado el servidor durante este periodo. Se obtiene de la estadística de total_connections_received en INFO.
nota

Si utiliza ElastiCache la versión 5 o inferior de Redis OSS, se utilizan entre dos y cuatro de las conexiones indicadas en esta métrica ElastiCache para supervisar el clúster. Sin embargo, si se utiliza ElastiCache para Redis OSS versión 6 o superior, las conexiones que utiliza ElastiCache para supervisar el clúster no se incluyen en esta métrica.

Recuento
NumItemsReadFromDisk El número total de elementos recuperados del disco por minuto. Compatible solo con clústeres que utilizan Organización de datos por niveles en ElastiCache. Recuento
NumItemsWrittenToDisk El número total de elementos escritos en disco por minuto. Compatible solo con clústeres que utilizan Organización de datos por niveles en ElastiCache. Recuento
MasterLinkHealthStatus Este estado tiene dos valores: 0 o 1. El valor 0 indica que los datos del nodo ElastiCache principal no están sincronizados con Valkey ni con Redis OSS activado. EC2 El valor 1 indica que los datos están sincronizados. Para completar la migración, utilice la operación de CompleteMigrationAPI. Booleano
Reclaimed El número total de eventos de vencimiento de clave. Se obtiene de la estadística de expired_keys en INFO. Recuento
ReplicationBytes Para los nodos en una configuración que se replica, ReplicationBytes indica el número de bytes que el nodo primario envía a todas las réplicas. Esta métrica representa la carga de escritura del grupo de reproducción. Se obtiene de la estadística de master_repl_offset en INFO. Bytes
ReplicationLag Esta métrica solo se aplica a un nodo que se ejecuta como una réplica de lectura. Representa lo que tarda la réplica en aplicar los cambios del nodo principal, en segundos. Para Valkey 7.2 y versiones posteriores y Redis OSS 5.0.6 en adelante, el retraso se puede medir en milisegundos. Segundos
SaveInProgress Esta métrica binaria devuelve 1 cuando hay una operación de guardado en segundo plano en curso (con ramificación o sin ella) y 0 en caso contrario. El proceso de guardado en segundo plano se usa normalmente durante las instantáneas y las sincronizaciones. Estas operaciones pueden mermar el rendimiento. Con la métrica SaveInProgress, puede diagnosticar si un proceso de guardado en segundo plano causó o no una merma del rendimiento. Se obtiene de la estadística de rdb_bgsave_in_progress en INFO. Booleano
TrafficManagementActive Indica si ElastiCache Redis OSS gestiona activamente el tráfico ajustando el tráfico asignado a los comandos entrantes, a la supervisión o a la replicación. El tráfico se administra cuando se envían más comandos al nodo de los que Valkey o Redis OSS pueden procesar y se utiliza para mantener la estabilidad y el funcionamiento óptimo del motor. Cualquier punto de datos de 1 puede indicar que ha disminuido la escala del nodo para la carga de trabajo que se proporciona.
nota

Si esta métrica permanece activa, evalúe el clúster para decidir si es necesario escalar verticalmente o escalar horizontalmente. Las métricas relacionadas incluyen NetworkBandwidthOutAllowanceExceeded y EngineCPUUtilization.

Booleano
SuccessfulWriteRequestLatency

Latencia de las solicitudes de escritura correctas.

Estadísticas válidas: promedio, suma, mínimo, máximo, recuento de muestras, cualquier percentil entre p0 y p100. El recuento de muestras incluye solo los comandos que se ejecutaron correctamente.

Microsegundos
SuccessfulReadRequestLatency

Latencia de las solicitudes de lectura correctas.

Estadísticas válidas: promedio, suma, mínimo, máximo, recuento de muestras, cualquier percentil entre p0 y p100. El recuento de muestras incluye solo los comandos que se ejecutaron correctamente.

Microsegundos
ErrorCount

El número total de comandos fallidos durante el período de tiempo especificado.

Estadísticas válidas: promedio, suma, mínimo, máximo

Recuento
CPUUtilization Disponibilidad del motor

AWS Las regiones que se enumeran a continuación están disponibles en todos los tipos de nodos compatibles.

Región Nombre de la región
us-east-2 Este de EE. UU. (Ohio)
us-east-1 Este de EE. UU. (Norte de Virginia)
us-west-1 Oeste de EE. UU. (Norte de California)
us-west-2 Oeste de EE. UU. (Oregón)
ap-northeast-1 Asia-Pacífico (Tokio)
ap-northeast-2 Asia-Pacífico (Seúl)
ap-northeast-3 Asia-Pacífico (Osaka)
ap-east-1 Asia-Pacífico (Hong Kong)
ap-south-1 Asia-Pacífico (Mumbai)
ap-southeast-1 Asia-Pacífico (Singapur)
ap-southeast-2 Asia-Pacífico (Sídney)
ap-southeast-3 Asia-Pacífico (Yakarta)
ca-central-1 Canadá (centro)
cn-north-1 China (Pekín)
cn-northwest-2 China (Ningxia)
me-south-1 Medio Oriente (Baréin)
eu-central-1 Europa (Fráncfort)
eu-west-1 Europa (Irlanda)
eu-west-2 Europa (Londres)
eu-west-3 UE (París)
eu-south-1 Europa (Milán)
af-south-1 África (Ciudad del Cabo)
eu-north-1 Europa (Estocolmo)
sa-east-1 América del Sur (São Paulo)
us-gov-west-1 AWS GovCloud (EE. UU.-Oeste)
us-gov-east-1 AWS GovCloud (EE. UU.-Este)

A continuación se muestran agrupaciones de determinados tipos de comandos, que se obtienen de info commandstats: La sección commandstats proporciona estadísticas basadas en el tipo de comando, incluido el número de llamadas, el tiempo total de CPU consumido por estos comandos y el promedio de CPU consumido por ejecución de comando. Para cada tipo de comando, se agrega la siguiente línea: cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX.

Las métricas de latencia que se indican a continuación se calculan con la estadística de commandstats de INFO. Se calculan de la siguiente manera: delta(usec)/delta(calls). delta se calcula como la diferencia en un minuto. La latencia se define como el tiempo de CPU que tarda la CPU ElastiCache en procesar el comando. Tenga en cuenta que para los clústeres que utilizan la organización de datos en niveles, el tiempo que tarda en obtener elementos de SSD no se incluye en estas mediciones.

Para obtener una lista completa de los comandos disponibles, consulte los comandos en la documentación de Valkey.

Métrica Descripción Unidad
ClusterBasedCmds El número total de comandos basados en clústeres. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en un clúster (cluster slot, cluster info, etc.). Recuento
ClusterBasedCmdsLatency Latencia de comandos basados en clústeres. Microsegundos
EvalBasedCmds El número total de comandos para los comandos basados en eval. Se obtiene de la estadística de commandstats sumando eval, evalsha. Recuento
EvalBasedCmdsLatency Latencia de comandos basados en eval. Microsegundos
GeoSpatialBasedCmds Número total de comandos para comandos basados en condiciones geoespaciales. Esto se obtiene de la estadística de commandstats. Esto se obtiene al sumar todos los tipos de comandos geográficos: geoadd, geodist, geohash, geopos, georadius y georadiusbymember. Recuento
GeoSpatialBasedCmdsLatency Latencia de comandos basados en condiciones geoespaciales. Microsegundos
GetTypeCmds El número total de comandos de escritura de read-only. Se obtiene de la estadística de commandstats sumando todos los tipos de comandos read-only (get, hget, scard, lrange, etc.). Recuento
GetTypeCmdsLatency Latencia de los comandos de lectura. Microsegundos
HashBasedCmds El número total de comandos basados en hash. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en uno o más algoritmos hash (hget, hkeys, hvals, hdel, etc.). Recuento
HashBasedCmdsLatency Latencia de comandos basados en hash. Microsegundos
HyperLogLogBasedCmds El número total de comandos basados en HyperLogLog. Se obtiene de la estadística de commandstats sumando todos los tipos de comandos pf (pfadd, pfcount, pfmerge, etc.). Recuento
HyperLogLogBasedCmdsLatency Latencia de los comandos HyperLogLog basados. Microsegundos
JsonBasedCmds El número total de comandos JSON, incluidos los comandos de lectura y escritura. Se obtiene de la estadística de commandstats sumando todos los comandos de JSON que actúan sobre claves de JSON. Recuento
JsonBasedCmdsLatency Latencia de todos los comandos JSON, incluidos los comandos de lectura y escritura. Microsegundos
JsonBasedGetCmds Número total de comandos de solo lectura de JSON. Se obtiene de la estadística de commandstats sumando todos los comandos de lectura de JSON que actúan sobre claves de JSON. Recuento
JsonBasedGetCmdsLatency Latencia de los comandos de solo lectura de JSON. Microsegundos
JsonBasedSetCmds Número total de comandos de escritura de JSON. Se obtiene de la estadística de commandstats sumando todos los comandos de escritura de JSON que actúan sobre claves de JSON. Recuento
JsonBasedSetCmdsLatency Latencia de los comandos de escritura de JSON. Microsegundos
KeyBasedCmds El número total de comandos basados en claves. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en una o más claves en varias estructuras de datos (del, expire, rename, etc.). Recuento
KeyBasedCmdsLatency Latencia de comandos basados en claves. Microsegundos
ListBasedCmds El número total de comandos basados en listas. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en una o más listas (lindex, lrange, lpush, ltrim, etc.). Recuento
ListBasedCmdsLatency Latencia de comandos basados en listas. Microsegundos
NonKeyTypeCmds Número total de comandos no basados en claves. Se obtiene de la estadística de commandstats sumando todos los comandos que no actúan sobre una clave, por ejemplo, acldbsize o info. Recuento
NonKeyTypeCmdsLatency Latencia de non-key-based los comandos. Microsegundos
PubSubBasedCmds El número total de comandos para la funcionalidad publicación/suscripción. Se obtiene de la estadística de commandstats sumando todos los comandos utilizados para la funcionalidad de publicación/suscripción: psubscribe, publish, pubsub, punsubscribe, ssubscribe, sunsubscribe, spublish, subscribe y unsubscribe. Recuento
PubSubBasedCmdsLatency Latencia de comandos basados en publicación/suscripción. Microsegundos
SetBasedCmds El número total de comandos basados en instrucciones set. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en uno o más conjuntos (scard, sdiff, sadd, sunion, etc.). Recuento
SetBasedCmdsLatency Latencia de comandos basados en conjuntos. Microsegundos
SetTypeCmds El número total de tipos de comandos de write. Se obtiene de la estadística de commandstats sumando todos los tipos de comandos mutative que actúan en los datos (set, hset. sadd, lpop, etc.). Recuento
SetTypeCmdsLatency Latencia de comandos de escritura. Microsegundos
SortedSetBasedCmds El número total de comandos basados en instrucciones set ordenadas. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en uno o más conjuntos ordenados (zcount, zrange, zrank, zadd, etc.). Recuento
SortedSetBasedCmdsLatency Latencia de comandos basados en orden. Microsegundos
StringBasedCmds El número total de comandos basados en cadenas. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en una o más cadenas (strlen, setex, setrange, etc.). Recuento
StringBasedCmdsLatency Latencia de comandos basados en cadenas Microsegundos
StreamBasedCmds El número total de comandos basados en secuencias. Se obtiene de la estadística de commandstats sumando todos los comandos que actúan en uno o más tipos de datos de flujo (xrange, xlen, xadd, xdel, etc.). Recuento
StreamBasedCmdsLatency Latencia de comandos basados en secuencias. Microsegundos