

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Métriques Container Insights pour Amazon EKS et Kubernetes


Les tableaux suivants répertorient les métriques et les dimensions collectées par Container Insights pour Amazon EKS et Kubernetes. Ces métriques sont dans l'espace de noms `ContainerInsights`. Pour plus d'informations, consultez . [Métriques](cloudwatch_concepts.md#Metric).

Si vous ne voyez pas toutes les métriques Container Insights dans votre console, assurez-vous que vous avez terminé la configuration de Container Insights. Les métriques n'apparaissent pas tant que Container Insights n'a pas été complètement configuré. Pour de plus amples informations, veuillez consulter [Configuration de Container Insights](deploy-container-insights.md).


| Nom de la métrique | Dimensions | Description | 
| --- | --- | --- | 
|  `cluster_failed_node_count`  |  `ClusterName`  |  Nombre d'échecs des nœuds de travail dans le cluster. Un nœud est considéré comme ayant échoué s'il souffre de *conditions de nœud*. Pour plus d'informations, consultez [Conditions](https://kubernetes.io/docs/concepts/architecture/nodes/#condition) dans la documentation Kubernetes.  | 
|  `cluster_node_count`  |  `ClusterName`  |  Nombre total de composants master dans le cluster.  | 
|  `namespace_number_of_running_pods`  |  `Namespace` `ClusterName` `ClusterName`  |  Nombre de pods exécutés par espace de nom dans la ressource spécifiée par les dimensions que vous utilisez.  | 
|  `node_cpu_limit`  |  `ClusterName`   |  Nombre maximal d'unités UC qui peut être attribué à un seul nœud du cluster.  | 
|  `node_cpu_reserved_capacity`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  Pourcentage d'unités UC qui sont réservées pour les composants de nœud, tels que Kubelet, Kube-proxy et Docker. Formule : `node_cpu_request / node_cpu_limit`  `node_cpu_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `node_cpu_usage_total`  |  `ClusterName`  |  Nombre d'unités UC en cours d'utilisation sur les nœuds du cluster.  | 
|  `node_cpu_utilization`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  Pourcentage total d'unités UC en cours d'utilisation sur les nœuds du cluster. Formule : `node_cpu_usage_total / node_cpu_limit`  | 
|  `node_gpu_limit` |  `ClusterName` `ClusterName`, `InstanceId`, `NodeName`  |  Le nombre total de GPU disponibles sur le nœud.  | 
|  `node_gpu_usage_total` |  `ClusterName` `ClusterName`, `InstanceId`, `NodeName`  |  Le nombre de GPU en cours d’utilisation par les pods en cours d’exécution sur le nœud.  | 
|  `node_gpu_reserved_capacity` |  `ClusterName` `ClusterName`, `InstanceId`, `NodeName`  |  Le pourcentage de GPU actuellement réservé sur le nœud. La formule est la suivante : `node_gpu_request / node_gpu_limit`.  `node_gpu_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).   | 
|  `node_filesystem_utilization`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  Pourcentage total d'une capacité de système de fichiers utilisée sur les nœuds du cluster. Formule : `node_filesystem_usage / node_filesystem_capacity`  `node_filesystem_usage` et `node_filesystem_capacity` ne sont pas indiqués directement sous forme de métrique, mais constituent des champs dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `node_memory_limit`  |  `ClusterName`  |  Quantité de mémoire maximale, en octets, qui peut être attribuée à un seul nœud du cluster.  | 
|  `node_memory_reserved_capacity`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  Pourcentage de mémoire actuellement utilisé sur les nœuds du cluster. Formule : `node_memory_request / node_memory_limit`  `node_memory_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `node_memory_utilization`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  Pourcentage de mémoire actuellement utilisé par le ou les nœuds. Il s'agit du pourcentage d'utilisation de la mémoire du nœud divisé par la limitation de la mémoire du nœud. Formule : `node_memory_working_set / node_memory_limit`.   | 
|  `node_memory_working_set`  |  `ClusterName`   |  Quantité de mémoire, en octets, utilisée dans l'ensemble de travail des nœuds du cluster.  | 
|  `node_network_total_bytes`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  Nombre total d'octets transmis et reçus par seconde sur le réseau par nœud dans un cluster. Formule : `node_network_rx_bytes + node_network_tx_bytes`  `node_network_rx_bytes` et `node_network_tx_bytes` ne sont pas indiqués directement sous forme de métrique, mais constituent des champs dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `node_number_of_running_containers`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  Nombre de conteneurs en cours d'exécution par nœud dans un cluster.  | 
|  `node_number_of_running_pods`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  Nombre de pods en cours d'exécution par nœud dans un cluster.  | 
|  `pod_cpu_reserved_capacity`  |  `PodName`, `Namespace`, `ClusterName` `ClusterName`  |  Capacité d'UC qui est réservée par pod dans un cluster. Formule : `pod_cpu_request / node_cpu_limit`  `pod_cpu_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `pod_cpu_utilization`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  Pourcentage d'unités UC utilisées par les pods. Formule : `pod_cpu_usage_total / node_cpu_limit`  | 
|  `pod_cpu_utilization_over_pod_limit`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  Pourcentage d'unités UC en cours d'utilisation par les pods par rapport à la limite des pods. Formule : `pod_cpu_usage_total / pod_cpu_limit`  | 
|  `pod_gpu_request` |  `ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`  |  Les requêtes de GPU pour le pod. Cette valeur doit toujours être égale à `pod_gpu_limit`.  | 
|  `pod_gpu_limit` |  `ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`  |  Le nombre maximum de GPU qui peuvent être assignés au pod dans un nœud.  | 
|  `pod_gpu_usage_total` |  `ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`  |  Le nombre de GPU en cours d’allocation sur le pod.  | 
|  `pod_gpu_reserved_capacity` |  `ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`  |  Le pourcentage de GPU actuellement réservé au pod. La formule est - pod\$1gpu\$1request / node\$1gpu\$1reserved\$1capacity.  | 
|  `pod_memory_reserved_capacity`  |  `PodName`, `Namespace`, `ClusterName` `ClusterName`  |  Pourcentage de mémoire réservé aux pods. Formule : `pod_memory_request / node_memory_limit`  `pod_memory_request` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `pod_memory_utilization`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  Pourcentage de mémoire actuellement utilisé par le ou les pods. Formule : `pod_memory_working_set / node_memory_limit`  | 
|  `pod_memory_utilization_over_pod_limit`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  Pourcentage de mémoire utilisé par les pods par rapport à la limite des pods. Si l'un des conteneurs dans le pod n'a pas de limite de mémoire définie, cette métrique n'apparaît pas. Formule : `pod_memory_working_set / pod_memory_limit`  | 
|  `pod_network_rx_bytes`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  Nombre d'octets reçus par seconde sur le réseau par le pod. Formule : `sum(pod_interface_network_rx_bytes)`  `pod_interface_network_rx_bytes` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `pod_network_tx_bytes`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  Nombre d'octets transmis par seconde sur le réseau par le pod. Formule : `sum(pod_interface_network_tx_bytes)`  `pod_interface_network_tx_bytes` n'est pas indiqué directement sous forme de métrique, mais constitue un champ dans les événements du journal des performances. Pour de plus amples informations, veuillez consulter [Champs pertinents dans les évènements de journaux de performance pour Amazon EKS et Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `pod_number_of_container_restarts`  |  `PodName`, `Namespace`, `ClusterName`  |  Nombre total de redémarrages de conteneur dans un pod.  | 
|  `service_number_of_running_pods`  |  `Service`, `Namespace`, `ClusterName` `ClusterName`  |  Nombre de blocs exécutant le ou les services du cluster.  | 

## Métriques Kueue


À partir de la version `v2.4.0-eksbuild.1` du module complémentaire CloudWatch Observability EKS, Container Insights for Amazon EKS prend en charge la collecte de métriques Kueue à partir de clusters Amazon EKS. Pour plus d’informations sur le module complémentaire, consultez [Installez l' CloudWatch agent avec le module complémentaire Amazon CloudWatch Observability EKS ou le graphique Helm](install-CloudWatch-Observability-EKS-addon.md).

Pour plus d’informations sur l’activation des métriques, consultez [Activation des métriques Kueue](install-CloudWatch-Observability-EKS-addon.md#enable-Kueue-metrics) pour les activer.

Les métriques Kueue qui sont collectées sont listées dans le tableau suivant. Ces métriques sont publiées dans l'espace de `ContainerInsights/Prometheus` noms dans CloudWatch. Pour filtrer ces métriques, utilisez les dimensions suivantes
+ `ClusterQueue`est le nom du ClusterQueue
+ Les valeurs possibles de `Status` sont `active` et `inadmissible`
+ Les valeurs possibles de `Reason` sont `Preempted`, `PodsReadyTimeout`, `AdmissionCheck`, `ClusterQueueStopped` et `InactiveWorkload`
+ `Flavor` est la saveur référencée.
+ `Resource` fait référence aux ressources informatiques du cluster, telles que `cpu`, `memory`, `gpu`, etc. 


| Nom de la métrique | Dimensions | Description | 
| --- | --- | --- | 
|  `kueue_pending_workloads` |  `ClusterName`, `ClusterQueue`, `Status` `ClusterName`, `ClusterQueue` `ClusterName`, `Status` `ClusterName`  |  Le nombre de charges de travail en attente.  | 
|  `kueue_evicted_workloads_total` |  `ClusterName`, `ClusterQueue`, `Reason` `ClusterName`, `ClusterQueue` `ClusterName`, `Reason` `ClusterName`  |  Le nombre total de charges de travail expulsées.  | 
|  `kueue_admitted_active_workloads` |  `ClusterName`, `ClusterQueue` `ClusterName`  |  Le nombre de charges de travail admises qui sont actives (non suspendues et non terminées).  | 
|  `kueue_cluster_queue_resource_usage` |  `ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`  |  Indique l'utilisation totale des ressources du ClusterQueue.  | 
|  `kueue_cluster_queue_nominal_quota` |  `ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`  |  Indique le quota de ressources du ClusterQueue.  | 