

# Métricas de Información de contenedores de Kubernetes y de Amazon EKS
<a name="Container-Insights-metrics-EKS"></a>

En las siguientes tablas, se muestran las métricas y las dimensiones que recopila Información de contenedores para Amazon EKS y Kubernetes. Estas métricas se encuentran en el espacio de nombres `ContainerInsights`. Para obtener más información, consulte [Métricas](cloudwatch_concepts.md#Metric).

Si no ve ninguna métrica de Información de contenedores en la consola, asegúrese de haber completado la configuración de Información de contenedores. Las métricas no aparecen antes de haber configurado por completo Información de contenedores. Para obtener más información, consulte [Configuración de Información de contenedores](deploy-container-insights.md).


| Nombre de métrica | Dimensiones | Descripción | 
| --- | --- | --- | 
|  `cluster_failed_node_count`  |  `ClusterName`  |  El número de nodos de trabajo con errores en el clúster. Se considera que un nodo ha fallado si está sufriendo de cualquiera de las *condiciones de nodo*. Para obtener más información, consulte [Conditions](https://kubernetes.io/docs/concepts/architecture/nodes/#condition) (Condiciones) en la documentación de Kubernetes.  | 
|  `cluster_node_count`  |  `ClusterName`  |  El número total de nodos de trabajo en el clúster.  | 
|  `namespace_number_of_running_pods`  |  `Namespace` `ClusterName` `ClusterName`  |  El número de pods que se ejecutan por espacio de nombres en el recurso que se especifica mediante las dimensiones que está utilizando.  | 
|  `node_cpu_limit`  |  `ClusterName`   |  El número máximo de unidades de CPU que se pueden asignar a un único nodo en este clúster.  | 
|  `node_cpu_reserved_capacity`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  El porcentaje de unidades de CPU que están reservadas para los componentes de nodos, como kubelet, kube-proxy y Docker. Fórmula: `node_cpu_request / node_cpu_limit`  `node_cpu_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `node_cpu_usage_total`  |  `ClusterName`  |  El número de unidades de CPU que se utilizan en los nodos del clúster.  | 
|  `node_cpu_utilization`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  El porcentaje total de unidades de CPU que se utilizan en los nodos del clúster. Fórmula: `node_cpu_usage_total / node_cpu_limit`  | 
|  `node_gpu_limit` |  `ClusterName` `ClusterName`, `InstanceId`, `NodeName`  |  El número total de GPU disponibles en el nodo.  | 
|  `node_gpu_usage_total` |  `ClusterName` `ClusterName`, `InstanceId`, `NodeName`  |  El número de GPU que utilizan los pods en ejecución en el nodo.  | 
|  `node_gpu_reserved_capacity` |  `ClusterName` `ClusterName`, `InstanceId`, `NodeName`  |  El porcentaje de GPU que se reserva actualmente en el nodo. La fórmula es, `node_gpu_request / node_gpu_limit`.  `node_gpu_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).   | 
|  `node_filesystem_utilization`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  El porcentaje total de capacidad de sistema de archivos que se utiliza en los nodos del clúster. Fórmula: `node_filesystem_usage / node_filesystem_capacity`  `node_filesystem_usage` y `node_filesystem_capacity` no se informan directamente como métricas, sino que son campos en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `node_memory_limit`  |  `ClusterName`  |  La cantidad máxima de memoria, en bytes, que se puede asignar a un único nodo en este clúster.  | 
|  `node_memory_reserved_capacity`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  El porcentaje de memoria que se utiliza actualmente en los nodos del clúster. Fórmula: `node_memory_request / node_memory_limit`  `node_memory_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `node_memory_utilization`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  El porcentaje de memoria que utiliza actualmente el nodo o los nodos. Es el porcentaje de uso de memoria de nodo sobre la limitación de memoria de nodo. Fórmula: `node_memory_working_set / node_memory_limit`.   | 
|  `node_memory_working_set`  |  `ClusterName`   |  La cantidad de memoria, en bytes, que se utiliza en el conjunto de trabajo de los nodos del clúster.  | 
|  `node_network_total_bytes`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  El número total de bytes por segundo transmitidos y recibidos a través de la red por nodo en un clúster. Fórmula: `node_network_rx_bytes + node_network_tx_bytes`  `node_network_rx_bytes` y `node_network_tx_bytes` no se informan directamente como métricas, sino que son campos en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `node_number_of_running_containers`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  El número de contenedores en ejecución por nodo en un clúster.  | 
|  `node_number_of_running_pods`  |  `NodeName`, `ClusterName`, `InstanceId` `ClusterName`  |  El número de pods en ejecución por nodo en un clúster.  | 
|  `pod_cpu_reserved_capacity`  |  `PodName`, `Namespace`, `ClusterName` `ClusterName`  |  La capacidad de la CPU reservada por pod en un clúster. Fórmula: `pod_cpu_request / node_cpu_limit`  `pod_cpu_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `pod_cpu_utilization`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  El porcentaje de unidades de CPU que utilizan los pods. Fórmula: `pod_cpu_usage_total / node_cpu_limit`  | 
|  `pod_cpu_utilization_over_pod_limit`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  El porcentaje de unidades de CPU utilizadas por pods en relación con el límite de pods. Fórmula: `pod_cpu_usage_total / pod_cpu_limit`  | 
|  `pod_gpu_request` |  `ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`  |  Las solicitudes de la GPU para el pod. Este valor siempre debe ser igual a `pod_gpu_limit`.  | 
|  `pod_gpu_limit` |  `ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`  |  El número máximo de GPU de un nodo que se pueden asignar al pod de un nodo.  | 
|  `pod_gpu_usage_total` |  `ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`  |  El número de GPU que se asignan al pod.  | 
|  `pod_gpu_reserved_capacity` |  `ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`  |  El porcentaje de GPU que se reserva actualmente en el pod. La fórmula es pod\$1gpu\$1request/node\$1gpu\$1reserved\$1capacity.  | 
|  `pod_memory_reserved_capacity`  |  `PodName`, `Namespace`, `ClusterName` `ClusterName`  |  El porcentaje de memoria reservada para los pods. Fórmula: `pod_memory_request / node_memory_limit`  `pod_memory_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `pod_memory_utilization`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  El porcentaje de memoria que utiliza actualmente el pod o los pods. Fórmula: `pod_memory_working_set / node_memory_limit`  | 
|  `pod_memory_utilization_over_pod_limit`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  El porcentaje de memoria utilizada por los pods en relación con el límite de pods. Si algún contenedor del pod no tiene definido un límite de memoria, esta métrica no aparecerá. Fórmula: `pod_memory_working_set / pod_memory_limit`  | 
|  `pod_network_rx_bytes`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  El número de bytes por segundo que se están recibiendo a través de la red por el pod. Fórmula: `sum(pod_interface_network_rx_bytes)`  `pod_interface_network_rx_bytes` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `pod_network_tx_bytes`  |  `PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`  |  El número de bytes por segundo que se están transmitiendo a través de la red por el pod. Fórmula: `sum(pod_interface_network_tx_bytes)`  `pod_interface_network_tx_bytes` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte [Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes](Container-Insights-reference-performance-entries-EKS.md).    | 
|  `pod_number_of_container_restarts`  |  `PodName`, `Namespace`, `ClusterName`  |  El número total de reinicios del contenedor en un pod.  | 
|  `service_number_of_running_pods`  |  `Service`, `Namespace`, `ClusterName` `ClusterName`  |  El número de pods que ejecutan el servicio o servicios en el clúster.  | 

## Métricas de Kueue
<a name="Container-Insights-metrics-Kueue"></a>

A partir de la versión `v2.4.0-eksbuild.1` del complemento de observabilidad de EKS de CloudWatch, Información de contenedores para Amazon EKS admite la recopilación de métricas de Kueue de clústeres de Amazon EKS. Para obtener más información acerca del complemento, consulte [Instalación del agente de CloudWatch con el complemento de observabilidad de EKS de Amazon CloudWatch o el gráfico de Helm](install-CloudWatch-Observability-EKS-addon.md).

Para obtener más información sobre la habilitación de las métricas, consulte [Habilitación de las métricas de Kueue](install-CloudWatch-Observability-EKS-addon.md#enable-Kueue-metrics) para habilitarlas.

Las métricas de Kueue que se recopilan se enumeran en la siguiente tabla. Estas métricas se publican en el espacio de nombres `ContainerInsights/Prometheus` de CloudWatch. Algunas de estas métricas utilizan las siguientes dimensiones:
+ `ClusterQueue` es el nombre de ClusterQueue
+ Los valores posibles de `Status` son `active` y `inadmissible`.
+ Los valores posibles de `Reason` son `Preempted`, `PodsReadyTimeout`, `AdmissionCheck`, `ClusterQueueStopped` y `InactiveWorkload`.
+ `Flavor` es la variedad a la que se hace referencia.
+ `Resource` hace referencia a los recursos de computación en clústeres, como `cpu`, `memory`, `gpu`, etc. 


| Nombre de métrica | Dimensiones | Descripción | 
| --- | --- | --- | 
|  `kueue_pending_workloads` |  `ClusterName`, `ClusterQueue`, `Status` `ClusterName`, `ClusterQueue` `ClusterName`, `Status` `ClusterName`  |  El número de cargas de trabajo pendientes.  | 
|  `kueue_evicted_workloads_total` |  `ClusterName`, `ClusterQueue`, `Reason` `ClusterName`, `ClusterQueue` `ClusterName`, `Reason` `ClusterName`  |  El número total de cargas de trabajo expulsadas.  | 
|  `kueue_admitted_active_workloads` |  `ClusterName`, `ClusterQueue` `ClusterName`  |  El número de cargas de trabajo admitidas que están activas (no suspendidas y no terminadas).  | 
|  `kueue_cluster_queue_resource_usage` |  `ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`  |  Indica el uso total de recursos de ClusterQueue.  | 
|  `kueue_cluster_queue_nominal_quota` |  `ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`  |  Indica la cuota de recursos de ClusterQueue.  | 