Métriques Container Insights pour Amazon EKS et Kubernetes

Les tableaux suivants répertorient les métriques et les dimensions collectées par Container Insights pour Amazon EKS et Kubernetes. Ces métriques sont dans l'espace de noms ContainerInsights. Pour plus d'informations, consultez . Métriques.

Si vous ne voyez pas toutes les métriques Container Insights dans votre console, assurez-vous que vous avez terminé la configuration de Container Insights. Les métriques n'apparaissent pas tant que Container Insights n'a pas été complètement configuré. Pour de plus amples informations, veuillez consulter Container Insights.

Nom de la métrique	Dimensions	Description
`cluster_failed_node_count`	`ClusterName`	Nombre d'échecs des nœuds de travail dans le cluster. Un nœud est considéré comme ayant échoué s'il souffre de conditions de nœud. Pour plus d'informations, consultez Conditions dans la documentation Kubernetes.
`cluster_node_count`	`ClusterName`	Nombre total de composants master dans le cluster.
`namespace_number_of_running_pods`	`Namespace` `ClusterName` `ClusterName`	Nombre de pods exécutés par espace de nom dans la ressource spécifiée par les dimensions que vous utilisez.
`node_cpu_limit`	`ClusterName`	Nombre maximal d'unités UC qui peut être attribué à un seul nœud du cluster.
`node_cpu_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Pourcentage d'unités UC qui sont réservées pour les composants de nœud, tels que Kubelet, Kube-proxy et Docker. Formule : `node_cpu_request / node_cpu_limit` Note `node_cpu_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`node_cpu_usage_total`	`ClusterName`	Nombre d'unités UC en cours d'utilisation sur les nœuds du cluster.
`node_cpu_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Pourcentage total d'unités UC en cours d'utilisation sur les nœuds du cluster. Formule : `node_cpu_usage_total / node_cpu_limit`
`node_gpu_limit`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Le nombre total de GPU disponibles sur le nœud.
`node_gpu_usage_total`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Le nombre de GPU en cours d’utilisation par les pods en cours d’exécution sur le nœud.
`node_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Le pourcentage de GPU actuellement réservé sur le nœud. La formule est la suivante : `node_gpu_request / node_gpu_limit`. Note `node_gpu_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`node_filesystem_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Pourcentage total d'une capacité de système de fichiers utilisée sur les nœuds du cluster. Formule : `node_filesystem_usage / node_filesystem_capacity` Note `node_filesystem_usage` et `node_filesystem_capacity` ne sont pas indiqués directement sous forme de métrique, mais constituent des champs dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`node_memory_limit`	`ClusterName`	Quantité de mémoire maximale, en octets, qui peut être attribuée à un seul nœud du cluster.
`node_memory_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Pourcentage de mémoire actuellement utilisé sur les nœuds du cluster. Formule : `node_memory_request / node_memory_limit` Note `node_memory_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`node_memory_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Pourcentage de mémoire actuellement utilisé par le ou les nœuds. Il s'agit du pourcentage d'utilisation de la mémoire du nœud divisé par la limitation de la mémoire du nœud. Formule : `node_memory_working_set / node_memory_limit`.
`node_memory_working_set`	`ClusterName`	Quantité de mémoire, en octets, utilisée dans l'ensemble de travail des nœuds du cluster.
`node_network_total_bytes`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Nombre total d'octets transmis et reçus par seconde sur le réseau par nœud dans un cluster. Formule : `node_network_rx_bytes + node_network_tx_bytes` Note `node_network_rx_bytes` et `node_network_tx_bytes` ne sont pas indiqués directement sous forme de métrique, mais constituent des champs dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`node_number_of_running_containers`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Nombre de conteneurs en cours d'exécution par nœud dans un cluster.
`node_number_of_running_pods`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Nombre de pods en cours d'exécution par nœud dans un cluster.
`pod_cpu_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	Capacité d'UC qui est réservée par pod dans un cluster. Formule : `pod_cpu_request / node_cpu_limit` Note `pod_cpu_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`pod_cpu_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Pourcentage d'unités UC utilisées par les pods. Formule : `pod_cpu_usage_total / node_cpu_limit`
`pod_cpu_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Pourcentage d'unités UC en cours d'utilisation par les pods par rapport à la limite des pods. Formule : `pod_cpu_usage_total / pod_cpu_limit`
`pod_gpu_request`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Les requêtes de GPU pour le pod. Cette valeur doit toujours être égale à `pod_gpu_limit`.
`pod_gpu_limit`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Le nombre maximum de GPU qui peuvent être assignés au pod dans un nœud.
`pod_gpu_usage_total`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Le nombre de GPU en cours d’allocation sur le pod.
`pod_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Le pourcentage de GPU actuellement réservé au pod. La formule est - pod_gpu_request / node_gpu_reserved_capacity.
`pod_memory_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	Pourcentage de mémoire réservé aux pods. Formule : `pod_memory_request / node_memory_limit` Note `pod_memory_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`pod_memory_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Pourcentage de mémoire actuellement utilisé par le ou les pods. Formule : `pod_memory_working_set / node_memory_limit`
`pod_memory_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Pourcentage de mémoire utilisé par les pods par rapport à la limite des pods. Si l'un des conteneurs dans le pod n'a pas de limite de mémoire définie, cette métrique n'apparaît pas. Formule : `pod_memory_working_set / pod_memory_limit`
`pod_network_rx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Nombre d'octets reçus par seconde sur le réseau par le pod. Formule : `sum(pod_interface_network_rx_bytes)` Note `pod_interface_network_rx_bytes` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`pod_network_tx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Nombre d'octets transmis par seconde sur le réseau par le pod. Formule : `sum(pod_interface_network_tx_bytes)` Note `pod_interface_network_tx_bytes` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes.
`pod_number_of_container_restarts`	`PodName`, `Namespace`, `ClusterName`	Nombre total de redémarrages de conteneur dans un pod.
`service_number_of_running_pods`	`Service`, `Namespace`, `ClusterName` `ClusterName`	Nombre de blocs exécutant le ou les services du cluster.

Métriques Kueue

À partir de la version v2.4.0-eksbuild.1 du module complémentaire CloudWatch Observability EKS, Container Insights for Amazon EKS prend en charge la collecte de métriques Kueue à partir de clusters Amazon EKS. Pour plus d’informations sur le module complémentaire, consultez Installez l' CloudWatch agent avec le module complémentaire Amazon CloudWatch Observability EKS ou le graphique Helm.

Pour plus d’informations sur l’activation des métriques, consultez Activation des métriques Kueue pour les activer.

Les métriques Kueue qui sont collectées sont listées dans le tableau suivant. Ces métriques sont publiées dans l'espace de ContainerInsights/Prometheus noms dans CloudWatch. Pour filtrer ces métriques, utilisez les dimensions suivantes

ClusterQueueest le nom du ClusterQueue
Les valeurs possibles de Status sont active et inadmissible
Les valeurs possibles de Reason sont Preempted, PodsReadyTimeout, AdmissionCheck, ClusterQueueStopped et InactiveWorkload
Flavor est la saveur référencée.
Resource fait référence aux ressources informatiques du cluster, telles que cpu, memory, gpu, etc.

Nom de la métrique	Dimensions	Description
`kueue_pending_workloads`	`ClusterName`, `ClusterQueue`, `Status` `ClusterName`, `ClusterQueue` `ClusterName`, `Status` `ClusterName`	Le nombre de charges de travail en attente.
`kueue_evicted_workloads_total`	`ClusterName`, `ClusterQueue`, `Reason` `ClusterName`, `ClusterQueue` `ClusterName`, `Reason` `ClusterName`	Le nombre total de charges de travail expulsées.
`kueue_admitted_active_workloads`	`ClusterName`, `ClusterQueue` `ClusterName`	Le nombre de charges de travail admises qui sont actives (non suspendues et non terminées).
`kueue_cluster_queue_resource_usage`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Indique l'utilisation totale des ressources du ClusterQueue.
`kueue_cluster_queue_nominal_quota`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Indique le quota de ressources du ClusterQueue.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Amazon EKS et Kubernetes Container Insights avec des métriques d’observabilité améliorées

Référence des journaux de performances

Métriques Container Insights pour Amazon EKS et Kubernetes

Note

Note

Note

Note

Note

Note

Note

Note

Note

Métriques Kueue