Parametri di Container Insights per Amazon EKS e Kubernetes

Le tabelle seguenti elencano le metriche e le dimensioni raccolti da Container Insights per Amazon EKS e Kubernetes. Tali metriche si trovano nel namespace ContainerInsights. Per ulteriori informazioni, consulta la pagina Metriche.

Se nella console non viene visualizzato alcun parametro di Container Insights, assicurati di aver completato la configurazione di Container Insights. I parametri vengono visualizzati solo dopo aver completato la configurazione di Container Insights. Per ulteriori informazioni, consulta Configurazione di Container Insights.

Nome parametro	Dimensioni	Description
`cluster_failed_node_count`	`ClusterName`	Il numero di nodi di lavoro non riusciti nel cluster. Un nodo è considerato non riuscito se risente delle condizioni del nodo. Per ulteriori informazioni, consulta Conditions (Condizioni) nella documentazione Kubernetes.
`cluster_node_count`	`ClusterName`	Il numero totale di nodi di lavoro nel cluster.
`namespace_number_of_running_pods`	`Namespace` `ClusterName` `ClusterName`	Il numero di pod in esecuzione per spazio dei nomi nella risorsa specificata dalle dimensioni in uso.
`node_cpu_limit`	`ClusterName`	Il numero massimo di unità di CPU che può essere assegnato a un singolo nodo nel cluster corrente.
`node_cpu_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale di unità CPU riservate per i componenti del nodo, ad esempio kubelet, kube-proxy e Docker. Formula: `node_cpu_request / node_cpu_limit` Nota `node_cpu_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_cpu_usage_total`	`ClusterName`	Il numero di unità di CPU in uso sui nodi del cluster.
`node_cpu_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale totale delle unità di CPU in uso sui nodi del cluster. Formula: `node_cpu_usage_total / node_cpu_limit`
`node_gpu_limit`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Il numero totale di GPU disponibili sul nodo.
`node_gpu_usage_total`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Il numero di GPU utilizzate dai pod in esecuzione sul nodo.
`node_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	La percentuale di GPU attualmente riservata sul nodo. La formula è, `node_gpu_request / node_gpu_limit`. Nota `node_gpu_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_filesystem_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale totale della capacità del file system in uso sui nodi del cluster. Formula: `node_filesystem_usage / node_filesystem_capacity` Nota `node_filesystem_usage` e `node_filesystem_capacity` non vengono riportati direttamente come parametri, ma sono campi nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_memory_limit`	`ClusterName`	La quantità massima di memoria, espressa in byte, che può essere assegnata a un singolo nodo nel cluster corrente.
`node_memory_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale di memoria attualmente utilizzata sui nodi del cluster. Formula: `node_memory_request / node_memory_limit` Nota `node_memory_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_memory_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale di memoria attualmente utilizzata dal nodo o dai nodi. È la percentuale di utilizzo della memoria del nodo rispetto alla limitazione di memoria del nodo. Formula: `node_memory_working_set / node_memory_limit`.
`node_memory_working_set`	`ClusterName`	La quantità di memoria, espressa in byte, in uso nel working set dei nodi del cluster.
`node_network_total_bytes`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Il numero totale di byte al secondo trasmessi e ricevuti tramite la rete per nodo in un cluster. Formula: `node_network_rx_bytes + node_network_tx_bytes` Nota `node_network_rx_bytes` e `node_network_tx_bytes` non vengono riportati direttamente come parametri, ma sono campi nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_number_of_running_containers`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Il numero di container in esecuzione per nodo in un cluster.
`node_number_of_running_pods`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Il numero di pod in esecuzione per nodo in un cluster.
`pod_cpu_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	La capacità della CPU riservata per pod in un cluster. Formula: `pod_cpu_request / node_cpu_limit` Nota `pod_cpu_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`pod_cpu_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di unità CPU utilizzate dai pod. Formula: `pod_cpu_usage_total / node_cpu_limit`
`pod_cpu_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di unità CPU utilizzata dai pod relativa al limite di pod. Formula: `pod_cpu_usage_total / pod_cpu_limit`
`pod_gpu_request`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Le richieste della GPU per il pod. Questo valore deve essere sempre uguale a `pod_gpu_limit`.
`pod_gpu_limit`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Il numero massimo di GPU che possono essere assegnate al pod in un nodo.
`pod_gpu_usage_total`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Il numero di GPU allocate sul pod.
`pod_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	La percentuale di GPU attualmente riservata per il pod. La formula è: pod_gpu_request / node_gpu_reserved_capacity.
`pod_memory_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di memoria riservata per i pod. Formula: `pod_memory_request / node_memory_limit` Nota `pod_memory_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`pod_memory_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di memoria attualmente utilizzata dal pod o dai pod. Formula: `pod_memory_working_set / node_memory_limit`
`pod_memory_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di memoria utilizzata dai pod relativa al limite di pod. Se uno qualsiasi dei container nel pod non ha un limite di memoria definito, questo parametro non viene visualizzato. Formula: `pod_memory_working_set / pod_memory_limit`
`pod_network_rx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Il numero di byte al secondo ricevuti sulla rete dal pod. Formula: `sum(pod_interface_network_rx_bytes)` Nota `pod_interface_network_rx_bytes` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`pod_network_tx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Il numero di byte al secondo trasmessi sulla rete dal pod. Formula: `sum(pod_interface_network_tx_bytes)` Nota `pod_interface_network_tx_bytes` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`pod_number_of_container_restarts`	`PodName`, `Namespace`, `ClusterName`	Il numero totale di riavvii del container in un pod.
`service_number_of_running_pods`	`Service`, `Namespace`, `ClusterName` `ClusterName`	Il numero di pod che eseguono il servizio o i servizi nel cluster.

Metriche Kueue

A partire dalla versione v2.4.0-eksbuild.1 del componente aggiuntivo CloudWatch Observability EKS, Container Insights for Amazon EKS supporta la raccolta di metriche Kueue dai cluster Amazon EKS. Per ulteriori informazioni sul componente aggiuntivo, consulta Installa l' CloudWatch agente con il componente aggiuntivo Amazon CloudWatch Observability EKS o il grafico Helm.

Per informazioni sull'abilitazione delle metriche, consulta Abilitazione delle metriche di Kueue per abilitarle.

Le metriche Kueue raccolte sono elencate nella tabella seguente. Queste metriche sono pubblicate nel namespace in. ContainerInsights/Prometheus CloudWatch Alcune delle seguenti metriche usano le dimensioni di seguito:

ClusterQueueè il nome del ClusterQueue
I valori possibili per Status sono active e inadmissible
I valori possibili per Reason sono Preempted, PodsReadyTimeout, AdmissionCheck, ClusterQueueStopped e InactiveWorkload
Flavor è la variante a cui si fa riferimento.
Resource si riferisce alle risorse di cluster computing, ad esempio cpu, memory, gpu e così via.

Nome parametro	Dimensioni	Description
`kueue_pending_workloads`	`ClusterName`, `ClusterQueue`, `Status` `ClusterName`, `ClusterQueue` `ClusterName`, `Status` `ClusterName`	Il numero di carichi di lavoro in sospeso.
`kueue_evicted_workloads_total`	`ClusterName`, `ClusterQueue`, `Reason` `ClusterName`, `ClusterQueue` `ClusterName`, `Reason` `ClusterName`	Il numero totale di carichi di lavoro espulsi.
`kueue_admitted_active_workloads`	`ClusterName`, `ClusterQueue` `ClusterName`	Il numero di carichi di lavoro ammessi che sono attivi (non sospesi e non completati).
`kueue_cluster_queue_resource_usage`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Riporta l'utilizzo totale delle risorse di ClusterQueue.
`kueue_cluster_queue_nominal_quota`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Riporta la quota di risorse di ClusterQueue.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Container Insights per Amazon EKS e Kubernetes con metriche di osservabilità migliorata

Documentazione di riferimento dei log delle prestazioni

Parametri di Container Insights per Amazon EKS e Kubernetes

Nota

Nota

Nota

Nota

Nota

Nota

Nota

Nota

Nota

Metriche Kueue