Métriques Container Insights pour Amazon EKS et Kubernetes - Amazon CloudWatch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Métriques Container Insights pour Amazon EKS et Kubernetes

Les tableaux suivants répertorient les métriques et les dimensions collectées par Container Insights pour Amazon EKS et Kubernetes. Ces métriques sont dans l'espace de noms ContainerInsights. Pour plus d'informations, consultez . Métriques.

Si vous ne voyez pas toutes les métriques Container Insights dans votre console, assurez-vous que vous avez terminé la configuration de Container Insights. Les métriques n'apparaissent pas tant que Container Insights n'a pas été complètement configuré. Pour de plus amples informations, veuillez consulter Configuration de Container Insights.

Nom de la métrique Dimensions Description

cluster_failed_node_count

ClusterName

Nombre d'échecs des nœuds de travail dans le cluster. Un nœud est considéré comme ayant échoué s'il souffre de conditions de nœud. Pour plus d'informations, consultez Conditions dans la documentation Kubernetes.

cluster_node_count

ClusterName

Nombre total de composants master dans le cluster.

namespace_number_of_running_pods

Namespace ClusterName

ClusterName

Nombre de pods exécutés par espace de nom dans la ressource spécifiée par les dimensions que vous utilisez.

node_cpu_limit

ClusterName

Nombre maximal d'unités UC qui peut être attribué à un seul nœud du cluster.

node_cpu_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

Pourcentage d'unités UC qui sont réservées pour les composants de nœud, tels que Kubelet, Kube-proxy et Docker.

Formule : node_cpu_request / node_cpu_limit

Note

node_cpu_request n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

node_cpu_usage_total

ClusterName

Nombre d'unités UC en cours d'utilisation sur les nœuds du cluster.

node_cpu_utilization

NodeName, ClusterName, InstanceId

ClusterName

Pourcentage total d'unités UC en cours d'utilisation sur les nœuds du cluster.

Formule : node_cpu_usage_total / node_cpu_limit

node_gpu_limit

ClusterName

ClusterName, InstanceId, NodeName

Nombre total de GPU disponibles sur le nœud.

node_gpu_usage_total

ClusterName

ClusterName, InstanceId, NodeName

Le nombre de GPU utilisés par les pods en cours d'exécution sur le nœud.

node_gpu_reserved_capacity

ClusterName

ClusterName, InstanceId, NodeName

Pourcentage de GPU actuellement réservé sur le nœud. La formule est,node_gpu_request / node_gpu_limit.

Note

node_gpu_request n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

node_filesystem_utilization

NodeName, ClusterName, InstanceId

ClusterName

Pourcentage total d'une capacité de système de fichiers utilisée sur les nœuds du cluster.

Formule : node_filesystem_usage / node_filesystem_capacity

Note

node_filesystem_usage et node_filesystem_capacity ne sont pas indiqués directement sous forme de métrique, mais constituent des champs dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

node_memory_limit

ClusterName

Quantité de mémoire maximale, en octets, qui peut être attribuée à un seul nœud du cluster.

node_memory_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

Pourcentage de mémoire actuellement utilisé sur les nœuds du cluster.

Formule : node_memory_request / node_memory_limit

Note

node_memory_request n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

node_memory_utilization

NodeName, ClusterName, InstanceId

ClusterName

Pourcentage de mémoire actuellement utilisé par le ou les nœuds. Il s'agit du pourcentage d'utilisation de la mémoire du nœud divisé par la limitation de la mémoire du nœud.

Formule : node_memory_working_set / node_memory_limit.

node_memory_working_set

ClusterName

Quantité de mémoire, en octets, utilisée dans l'ensemble de travail des nœuds du cluster.

node_network_total_bytes

NodeName, ClusterName, InstanceId

ClusterName

Nombre total d'octets transmis et reçus par seconde sur le réseau par nœud dans un cluster.

Formule : node_network_rx_bytes + node_network_tx_bytes

Note

node_network_rx_bytes et node_network_tx_bytes ne sont pas indiqués directement sous forme de métrique, mais constituent des champs dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

node_number_of_running_containers

NodeName, ClusterName, InstanceId

ClusterName

Nombre de conteneurs en cours d'exécution par nœud dans un cluster.

node_number_of_running_pods

NodeName, ClusterName, InstanceId

ClusterName

Nombre de pods en cours d'exécution par nœud dans un cluster.

pod_cpu_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

Capacité d'UC qui est réservée par pod dans un cluster.

Formule : pod_cpu_request / node_cpu_limit

Note

pod_cpu_request n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

pod_cpu_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Pourcentage d'unités UC utilisées par les pods.

Formule : pod_cpu_usage_total / node_cpu_limit

pod_cpu_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Pourcentage d'unités UC en cours d'utilisation par les pods par rapport à la limite des pods.

Formule : pod_cpu_usage_total / pod_cpu_limit

pod_gpu_request

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Le GPU demande le pod. Cette valeur doit toujours être égale àpod_gpu_limit.

pod_gpu_limit

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Le nombre maximum de GPU pouvant être affectés au pod dans un nœud.

pod_gpu_usage_total

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Le nombre de GPU alloués sur le pod.

pod_gpu_reserved_capacity

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Pourcentage de GPU actuellement réservé au pod. La formule est la suivante : pod_gpu_request/node_gpu_reserved_capacity.

pod_memory_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

Pourcentage de mémoire réservé aux pods.

Formule : pod_memory_request / node_memory_limit

Note

pod_memory_request n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

pod_memory_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Pourcentage de mémoire actuellement utilisé par le ou les pods.

Formule : pod_memory_working_set / node_memory_limit

pod_memory_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Pourcentage de mémoire utilisé par les pods par rapport à la limite des pods. Si l'un des conteneurs dans le pod n'a pas de limite de mémoire définie, cette métrique n'apparaît pas.

Formule : pod_memory_working_set / pod_memory_limit

pod_network_rx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Nombre d'octets reçus par seconde sur le réseau par le pod.

Formule : sum(pod_interface_network_rx_bytes)

Note

pod_interface_network_rx_bytes n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

pod_network_tx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Nombre d'octets transmis par seconde sur le réseau par le pod.

Formule : sum(pod_interface_network_tx_bytes)

Note

pod_interface_network_tx_bytes n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.

pod_number_of_container_restarts

PodName, Namespace, ClusterName

Nombre total de redémarrages de conteneur dans un pod.

service_number_of_running_pods

Service, Namespace, ClusterName

ClusterName

Nombre de blocs exécutant le ou les services du cluster.

Métriques de Kueue

À partir de la version v2.4.0-eksbuild.1 du module complémentaire CloudWatch Observability EKS, Container Insights for Amazon EKS prend en charge la collecte de métriques Kueue à partir de clusters Amazon EKS. Pour plus d'informations sur le module complémentaire, consultezInstallez l' CloudWatch agent avec le module complémentaire Amazon CloudWatch Observability EKS ou le graphique Helm.

Pour plus d'informations sur l'activation des métriques, reportez-vous Activer les métriques Kueue à la section pour les activer.

Les métriques Kueue collectées sont répertoriées dans le tableau suivant. Ces métriques sont publiées dans l'espace de ContainerInsights/Prometheus noms dans CloudWatch. Certaines de ces mesures utilisent les dimensions suivantes :

  • ClusterQueueest le nom du ClusterQueue

  • Les valeurs possibles de Status sont active et inadmissible

  • Les valeurs possibles de Reason sont PreemptedPodsReadyTimeout,AdmissionCheck,ClusterQueueStopped, et InactiveWorkload

  • Flavorest l'arôme référencé.

  • Resourcefait référence aux ressources informatiques du cluster cpumemory, telles quegpu,,, etc.

Nom de la métrique Dimensions Description

kueue_pending_workloads

ClusterName, ClusterQueue, Status

ClusterName, ClusterQueue

ClusterName, Status

ClusterName

Le nombre de charges de travail en attente.

kueue_evicted_workloads_total

ClusterName, ClusterQueue, Reason

ClusterName, ClusterQueue

ClusterName, Reason

ClusterName

Le nombre total de charges de travail expulsées.

kueue_admitted_active_workloads

ClusterName, ClusterQueue

ClusterName

Le nombre de charges de travail admises qui sont actives (non suspendues et non terminées).

kueue_cluster_queue_resource_usage

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Indique l'utilisation totale des ressources du ClusterQueue.

kueue_cluster_queue_nominal_quota

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Indique le quota de ressources du ClusterQueue.