Métriques pour Valkey et Redis OSS - Amazon ElastiCache

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Métriques pour Valkey et Redis OSS

L'espace de Amazon ElastiCache noms inclut les métriques Valkey et Redis OSS suivantes. Ces métriques sont les mêmes lorsque vous utilisez le moteur Valkey.

À l'exception deReplicationLag, EngineCPUUtilizationSuccessfulWriteRequestLatency, etSuccessfulReadRequestLatency, ces métriques sont dérivées de la info commande. Chaque métrique est calculée au niveau du nœud de cache.

Pour une documentation complète de la info commande, consultez http://valkey. io/commands/info.

Voir aussi

Métrique Description Unité
ActiveDefragHits Nombre de réallocations de valeur par minute effectuées par le processus de défragmentation actif. Ceci est dérivé des active_defrag_hits statistiques d'INFO. Nombre
AuthenticationFailures Nombre total de tentatives infructueuses d'authentification auprès de Valkey ou Redis OSS à l'aide de la commande AUTH. Vous trouverez plus d'informations sur les échecs d'authentification individuels à l'aide de la commande ACL LOG. Nous vous suggérons de déclencher une alarme pour détecter les tentatives d'accès non autorisés. Nombre
BytesUsedForCache Le nombre total d'octets alloués par Valkey ou Redis OSS à toutes fins utiles, y compris le jeu de données, les tampons, etc. Octets
Dimension: Tier=Memorypour les clusters Valkey ou Redis OSS en utilisant Hiérarchisation des données ElastiCache : Le nombre total d'octets utilisés pour le cache par mémoire. Il s'agit de la valeur de la used_memory statistique sur INFO. Octets
Dimension: Tier=SSDpour les clusters Valkey ou Redis OSS en utilisant Hiérarchisation des données ElastiCache : Le nombre total d'octets utilisés pour le cache par SSD. Octets
BytesReadFromDisk Nombre total d’octets lus sur le disque par minute. Pris en charge uniquement pour les clusters utilisant Hiérarchisation des données ElastiCache. Octets
BytesWrittenToDisk Nombre total d'’octets écrits sur le disque par minute. Pris en charge uniquement pour les clusters utilisant Hiérarchisation des données ElastiCache. Octets
CacheHits Le nombre de recherches réussies de clés en lecture seule dans le dictionnaire principal. Ceci est dérivé des keyspace_hits statistiques d'INFO. Nombre
CacheMisses Le nombre de recherches non-réussies de clés en lecture seule dans le dictionnaire principal. Ceci est dérivé des keyspace_misses statistiques d'INFO. Nombre
CommandAuthorizationFailures Nombre total de tentatives infructueuses par les utilisateurs d'exécuter des commandes qu'ils n'ont pas l'autorisation d'appeler. Vous trouverez plus d'informations sur les échecs d'authentification individuels à l'aide de la commande ACL LOG. Nous vous suggérons de déclencher une alarme pour détecter les tentatives d'accès non autorisés. Nombre
CacheHitRate Indique l'efficacité d'utilisation de l'instance Valkey ou Redis OSS. Si le ratio de cache est inférieur à ~0,8, cela indique qu'une quantité importante de clés est expulsée, expirée ou n'existe pas. Ce ratio est calculé en utilisant les statistiques cache_hits et cache_misses de la manière suivante : cache_hits /(cache_hits + cache_misses). Pourcentage
ChannelAuthorizationFailures Nombre total de tentatives infructueuses par les utilisateurs d'accéder aux canaux auxquels ils n'ont pas l'autorisation d'accéder. Vous trouverez plus d'informations sur les échecs d'authentification individuels à l'aide de la commande ACL LOG. Nous vous suggérons de déclencher une alarme sur cette métrique pour détecter les tentatives d'accès non autorisés. Nombre
CurrConnections Le nombre de connexions client, à l'exclusion des connexions issues des répliques de lecture. ElastiCache utilise 4 à 6 connexions pour surveiller le cluster dans chaque cas. Ceci est dérivé des connected_clients statistiques d'INFO. Nombre
CurrItems Nombre d'éléments dans le cache. Ceci est dérivé de la keyspace statistique, en additionnant toutes les touches de l'ensemble du keyspace. Nombre
Dimension: Tier=Memory pour les clusters utilisant Hiérarchisation des données ElastiCache. Nombre d’éléments en mémoire. Nombre
Dimension: Tier=SSD (lecteur à état solide) pour les clusters utilisant Hiérarchisation des données ElastiCache. Nombre d’éléments dans le disque SSD. Nombre
CurrVolatileItems Nombre total de clés dans toutes les bases de données qui ont un ttl défini. Ceci est dérivé de la expires statistique, en additionnant toutes les touches avec un ttl défini dans l'ensemble du keyspace. Nombre
DatabaseCapacityUsagePercentage

Pourcentage de la capacité de données totale pour le cluster en cours d'utilisation.

Sur les instances Data Tiered, la métrique est calculée sous la forme(used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), où used_memory et maxmemory est extraite de INFO.

Dans tous les autres cas, la métrique est calculée à l'aide deused_memory/maxmemory.

Pourcentage
DatabaseCapacityUsageCountedForEvictPercentage

Pourcentage de la capacité de données totale pour le cluster en cours d'utilisation, à l'exclusion de la mémoire utilisée pour le traitement et le COB. Cette métrique est calculée comme suit :

used_memory - mem_not_counted_for_evict/maxmemory

Sur les instances avec hiérarchisation des données, la métrique est calculée comme suit :

(used_memory + SSD used) / (maxmemory + SSD total capacity)

used_memory et maxmemory sont tirés d'INFO

Pourcentage
DatabaseMemoryUsagePercentage Pourcentage de la mémoire pour le cluster qui est en cours d'utilisation. Ceci est calculé à used_memory/maxmemory partir de INFO. Pourcentage
DatabaseMemoryUsageCountedForEvictPercentage Pourcentage de la mémoire pour le cluster qui est en cours d’utilisation, à l’exclusion de la mémoire utilisée pour le traitement et le COB. Ceci est calculé à used_memory-mem_not_counted_for_evict/maxmemory partir de INFO. Pourcentage
DB0AverageTTL Expose avg_ttl le DBO à partir des keyspace statistiques de la commande INFO. Les réplicas ne font pas expirer les clés, mais attendent plutôt que les nœuds primaires fassent expirer les clés. Lorsqu'un nœud primaire fait expirer une clé (ou l'expulse en tant que moins récemment utilisée), il synthétise une commande DEL, qui est transmise à tous les réplicas. Par conséquent, DB0AverageTTL a pour valeur 0 pour les nœuds de réplica, car ils ne font pas expirer les clés et ne suivent donc pas la TTL. Millisecondes
EngineCPUUtilization

Fournit l'utilisation du processeur du thread du moteur Valkey ou Redis OSS. Valkey et Redis OSS étant mono-thread, vous pouvez utiliser cette métrique pour analyser la charge du processus lui-même. La EngineCPUUtilization métrique fournit une visibilité plus précise du processus. La métrique CPUUtilization complète la métrique CPUUtilization préexistante qui expose l'utilisation du CPU pour l'instance du serveur dans son ensemble, y compris les autres processus du système d'exploitation et les autres processus de gestion. Pour les types de nœuds plus grands avec quatre v CPUs ou plus, utilisez la EngineCPUUtilization métrique pour surveiller et définir des seuils de dimensionnement.

Note

Sur un ElastiCache hôte, des processus d'arrière-plan surveillent l'hôte afin de fournir une expérience de base de données gérée. Ces processus en arrière-plan peuvent prendre une part importante de la charge de travail du processeur. Cela n'est pas significatif sur les hôtes plus grands avec plus de deux CPUs v. Mais cela peut affecter les hôtes plus petits avec 2 V CPUs ou moins. Si vous ne surveillez que la EngineCPUUtilization métrique, vous ne serez pas au courant des situations dans lesquelles l'hôte est surchargé en raison à la fois d'une utilisation élevée du processeur par Valkey ou Redis OSS et d'une utilisation élevée du processeur due aux processus de surveillance en arrière-plan. Par conséquent, nous vous recommandons de surveiller la CPUUtilization métrique pour les hôtes dont la valeur est inférieure CPUs ou égale à deux v.

Pourcentage
Evictions Nombre de clés qui ont été expulsées en raison de la limite maxmemory. Ceci est dérivé des evicted_keys statistiques d'INFO. Nombre
GlobalDatastoreReplicationLag Il s'agit du décalage entre le nœud primaire de la région secondaire et le nœud primaire de la région primaire. Pour Valkey ou Redis OSS activé en mode cluster, le décalage indique le délai maximal entre les partitions. Secondes
IamAuthenticationExpirations Le nombre total de connexions Valkey ou Redis OSS authentifiées par IAM expirées. Vous trouverez plus d'informations sur Authentification avec IAM dans le guide de l'utilisateur. Nombre
IamAuthenticationThrottling Le nombre total de demandes Valkey ou Redis OSS AUTH ou HELLO limitées authentifiées par IAM. Vous trouverez plus d'informations sur Authentification avec IAM dans le guide de l'utilisateur. Nombre
IsMaster Indique si le nœud est le nœud primaire de la partition/du cluster courant. La métrique peut être égale à 0 (non primaire) ou 1 (primaire). Nombre
KeyAuthorizationFailures Nombre total de tentatives infructueuses par les utilisateurs d'accéder aux clés auxquelles ils n'ont pas l'autorisation d'accéder. Vous trouverez plus d'informations sur les échecs d'authentification individuels à l'aide de la commande ACL LOG. Nous vous suggérons de déclencher une alarme pour détecter les tentatives d'accès non autorisés. Nombre
KeysTracked Le nombre de clés suivies par le suivi des clés Valkey ou Redis OSS en pourcentage de. tracking-table-max-keys Le suivi des clés est utilisé pour faciliter la mise en cache côté client et avertit les clients lorsque les clés sont modifiées. Nombre
MemoryFragmentationRatio Indique l'efficacité de l'allocation de mémoire du moteur Valkey ou Redis OSS. Certains seuils indiqueront différents comportements. La valeur recommandée est d'avoir une fragmentation supérieure à 1.0. Ceci est calculé à partir mem_fragmentation_ratio statistic de l'INFO. Nombre
NewConnections Nombre total de connexions qui ont été acceptées par le serveur au cours de cette période. Ceci est dérivé des total_connections_received statistiques d'INFO.
Note

Si vous utilisez ElastiCache Redis OSS version 5 ou inférieure, entre deux et quatre des connexions signalées par cette métrique sont utilisées ElastiCache pour surveiller le cluster. Toutefois, lors de l'utilisation ElastiCache de Redis OSS version 6 ou ultérieure, les connexions utilisées ElastiCache pour surveiller le cluster ne sont pas incluses dans cette métrique.

Nombre
NumItemsReadFromDisk Nombre total d’éléments récupérés à partir du disque par minute. Pris en charge uniquement pour les clusters utilisant Hiérarchisation des données ElastiCache. Nombre
NumItemsWrittenToDisk Nombre total d’éléments écrits sur disque par minute. Pris en charge uniquement pour les clusters utilisant Hiérarchisation des données ElastiCache. Nombre
MasterLinkHealthStatus Cet état a deux valeurs : 0 ou 1. La valeur 0 indique que les données du nœud ElastiCache principal ne sont pas synchronisées avec Valkey ou Redis OSS activé. EC2 Une valeur égale à 1 signifie que les données sont synchronisées. Pour terminer la migration, utilisez l'opération CompleteMigrationAPI. Booléen
Reclaimed Nombre total d'événements d'expiration de clé. Ceci est dérivé des expired_keys statistiques d'INFO. Nombre
ReplicationBytes Pour les nœuds dans une configuration répliquée, ReplicationBytes indique le nombre d'octets que le principal envoie à toutes ses réplicas. Cette métrique est représentative de la charge d'écriture sur le groupe de réplication. Ceci est dérivé des master_repl_offset statistiques d'INFO. Octets
ReplicationLag Cette métrique ne s'applique qu'à un nœud de s'exécutant en tant que réplica en lecture. Elle représente le retard, en secondes, de l'application par le réplica des modifications provenant du nœud principal. Pour Valkey 7.2 et versions ultérieures, et Redis OSS 5.0.6 et versions ultérieures, le décalage peut être mesuré en millisecondes. Secondes
SaveInProgress Cette métrique binaire renvoie la valeur 1 lorsqu'un enregistrement en arrière-plan (avec ou sans autoclonage) est en cours. Sinon, elle renvoie la valeur 0. Un processus d'enregistrement en arrière-plan est généralement utilisé lors des instantanés et des synchronisations. Ces opérations peuvent entraîner une dégradation des performances. La métrique SaveInProgress vous permet de diagnostiquer si la dégradation des performances a été provoquée par un processus d'enregistrement en arrière-plan. Ceci est dérivé des rdb_bgsave_in_progress statistiques d'INFO. Booléen
TrafficManagementActive Indique si ElastiCache Redis OSS gère activement le trafic en ajustant le trafic alloué aux commandes entrantes, à la surveillance ou à la réplication. Le trafic est géré lorsque le nombre de commandes envoyées au nœud est supérieur à ce qui peut être traité par Valkey ou Redis OSS et est utilisé pour maintenir la stabilité et le fonctionnement optimal du moteur. Tout point de données de valeur 1 peut indiquer que le nœud est sous-dimensionné pour la charge de travail fournie.
Note

Si cette métrique reste active, évaluez le cluster pour décider s'il est nécessaire de l'augmenter ou de le réduire. Les métriques associées incluent NetworkBandwidthOutAllowanceExceeded et EngineCPUUtilization.

Booléen
SuccessfulWriteRequestLatency

Latence des demandes d'écriture réussies.

Statistiques valides : moyenne, somme, minimum, maximum, nombre d'échantillons, tout percentile compris entre p0 et p100. Le nombre d'échantillons inclut uniquement les commandes exécutées avec succès.

Microsecondes
SuccessfulReadRequestLatency

Latence des demandes de lecture réussies.

Statistiques valides : moyenne, somme, minimum, maximum, nombre d'échantillons, tout percentile compris entre p0 et p100. Le nombre d'échantillons inclut uniquement les commandes exécutées avec succès.

Microsecondes
ErrorCount

Nombre total de commandes ayant échoué pendant la période spécifiée.

Statistiques valides : moyenne, somme, min, max.

Nombre
CPUUtilization Disponibilité du moteur

AWS Les régions répertoriées ci-dessous sont disponibles sur tous les types de nœuds pris en charge.

Région Nom de la région
us-east-2 USA Est (Ohio)
us-east-1 USA Est (Virginie du Nord)
us-west-1 USA Ouest (Californie du Nord)
us-west-2 USA Ouest (Oregon)
ap-northeast-1 Asie Pacifique (Tokyo)
ap-northeast-2 Asie-Pacifique (Séoul)
ap-northeast-3 Asie-Pacifique (Osaka)
ap-east-1 Asie-Pacifique (Hong Kong)
ap-south-1 Asie-Pacifique (Mumbai)
ap-southeast-1 Asie-Pacifique (Singapour)
ap-southeast-2 Asie-Pacifique (Sydney)
ap-southeast-3 Asie-Pacifique (Jakarta)
ca-central-1 Canada (Centre)
cn-north-1 Chine (Beijing)
cn-northwest-2 Chine (Ningxia)
me-south-1 Moyen-Orient (Bahreïn)
eu-central-1 Europe (Francfort)
eu-west-1 Europe (Irlande)
eu-west-2 Europe (Londres)
eu-west-3 UE (Paris)
eu-south-1 Europe (Milan)
af-south-1 Afrique (Le Cap)
eu-north-1 Europe (Stockholm)
sa-east-1 Amérique du Sud (São Paulo)
us-gov-west-1 AWS GovCloud (US-Ouest)
us-gov-east-1 AWS GovCloud (USA Est)

Voici des regroupements de certains types de commandes, dérivés de info commandstats. La section commandstats fournit des statistiques basées sur le type de commande, y compris le nombre d'appels, le temps CPU total consommé par ces commandes et le CPU moyen consommé par exécution de commande. Pour chaque type de commande, la ligne suivante est ajoutée : cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX.

Les mesures de latence répertoriées ci-dessous sont calculées à l'aide des statistiques de commande d'INFO. Elles sont calculées de la manière suivante : delta(usec)/delta(calls). delta est calculé comme la diff. dans une minute. La latence est définie comme le temps nécessaire au processeur ElastiCache pour traiter la commande. Notez que pour les clusters utilisant la hiérarchisation des données, le temps nécessaire à la récupération des éléments à partir du SSD n’est pas inclus dans ces mesures.

Pour une liste complète des commandes disponibles, consultez les commandes dans la documentation de Valkey.

Métrique Description Unité
ClusterBasedCmds Nombre total de commandes basées sur un cluster. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui agissent sur un cluster (cluster slot,cluster info, etc.). Nombre
ClusterBasedCmdsLatency Latence des commandes basées sur un cluster. Microsecondes
EvalBasedCmds Nombre total de commandes pour les commandes basées sur eval. Ceci est dérivé de la commandstats statistique en additionnanteval,. evalsha Nombre
EvalBasedCmdsLatency Latence des commandes basées sur Eval. Microsecondes
GeoSpatialBasedCmds Nombre total de commandes pour les commandes basées sur la géolocalisation. Ceci est dérivé de la commandstats statistique. Il est dérivé en additionnant tous les types de commandes géo : geoadd, geodist, geohash, geopos, georadius et georadiusbymember. Nombre
GeoSpatialBasedCmdsLatency Latence des commandes basées sur la géolocalisation. Microsecondes
GetTypeCmds Le nombre total de commandes basées sur les types de commandes read-only. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes de read-only type (gethget,scard,lrange,, etc.) Nombre
GetTypeCmdsLatency Latence des commandes de lecture. Microsecondes
HashBasedCmds Nombre total de commandes basées sur le hachage. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui agissent sur un ou plusieurs hachages (hget,,,hkeys, hvalshdel, etc.). Nombre
HashBasedCmdsLatency Latence des commandes basées sur le hachage. Microsecondes
HyperLogLogBasedCmds Nombre total de commandes basées sur HyperLogLog. Ceci est dérivé de la commandstats statistique en additionnant tous les pf types de commandes (pfaddpfcount,pfmerge,, etc.). Nombre
HyperLogLogBasedCmdsLatency Latence des commandes HyperLogLog basées. Microsecondes
JsonBasedCmds Nombre total de commandes JSON, y compris les commandes de lecture et d'écriture. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes JSON qui agissent sur les clés JSON. Nombre
JsonBasedCmdsLatency Latence de toutes les commandes JSON, y compris les commandes de lecture et d'écriture. Microsecondes
JsonBasedGetCmds Nombre total de commandes en lecture seule JSON. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes de lecture JSON qui agissent sur les clés JSON. Nombre
JsonBasedGetCmdsLatency Latence des commandes en lecture seule JSON. Microsecondes
JsonBasedSetCmds Nombre total de commandes d'écriture JSON. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes d'écriture JSON qui agissent sur les clés JSON. Nombre
JsonBasedSetCmdsLatency Latence des commandes d'écriture JSON. Microsecondes
KeyBasedCmds Nombre total de commandes basées sur une clé. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui agissent sur une ou plusieurs touches dans plusieurs structures de données (delexpire,rename,, etc.). Nombre
KeyBasedCmdsLatency Latence des commandes basées sur les clés. Microsecondes
ListBasedCmds Nombre total de commandes basées sur une liste. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui agissent sur une ou plusieurs listes (lindex,lrange,lpush,ltrim, etc.). Nombre
ListBasedCmdsLatency Latence des commandes basées sur la liste. Microsecondes
NonKeyTypeCmds Nombre total de commandes non basées sur des clés. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui n'agissent pas sur une touche, par exempleacl, dbsize ou. info Nombre
NonKeyTypeCmdsLatency Latence des non-key-based commandes. Microsecondes
PubSubBasedCmds Nombre total de commandes pour la fonctionnalité pub/sub. Ceci est dérivé des commandstats statistiques en additionnant toutes les commandes utilisées pour les fonctionnalités pub/sub :psubscribe,,publish,pubsub,punsubscribe, ssubscribe sunsubscribespublish, subscribe et. unsubscribe Nombre
PubSubBasedCmdsLatency Latence des commandes basées sur pub/sub. Microsecondes
SetBasedCmds Nombre total de commandes basées sur un ensemble. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui agissent sur un ou plusieurs ensembles (scard,sdiff,sadd,sunion, etc.). Nombre
SetBasedCmdsLatency Latence des commandes basées sur des ensembles. Microsecondes
SetTypeCmds Le nombre total de commandes de type write. Ceci est dérivé de la commandstats statistique en additionnant tous les mutative types de commandes qui opèrent sur les données (sethset,sadd,lpop,, etc.) Nombre
SetTypeCmdsLatency Latence des commandes d'écriture. Microsecondes
SortedSetBasedCmds Nombre total de commandes qui sont triées en fonction d'un ensemble. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui agissent sur un ou plusieurs ensembles triés (zcount,zrange,zrank,zadd, etc.). Nombre
SortedSetBasedCmdsLatency Latence des commandes basées sur le tri. Microsecondes
StringBasedCmds Nombre total de commandes basées sur une chaîne. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui agissent sur une ou plusieurs chaînes (strlen,setex,setrange, etc.). Nombre
StringBasedCmdsLatency Latence des commandes basées sur des chaînes Microsecondes
StreamBasedCmds Nombre total de commandes basées sur un flux. Ceci est dérivé de la commandstats statistique en additionnant toutes les commandes qui agissent sur un ou plusieurs types de données de flux (xrange,xlen,xadd,xdel, etc.). Nombre
StreamBasedCmdsLatency Latence des commandes basées sur des flux. Microsecondes