Parametri di Container Insights per Amazon EKS e Kubernetes - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Parametri di Container Insights per Amazon EKS e Kubernetes

Le tabelle seguenti elencano le metriche e le dimensioni raccolte da Container Insights per Amazon EKS e Kubernetes. Tali parametri si trovano nello spazio dei nomi ContainerInsights. Per ulteriori informazioni, consulta la pagina Metriche.

Se nella console non viene visualizzato alcun parametro di Container Insights, assicurati di aver completato la configurazione di Container Insights. I parametri vengono visualizzati solo dopo aver completato la configurazione di Container Insights. Per ulteriori informazioni, consulta Configurazione di Container Insights.

Nome parametro Dimensioni Descrizione

cluster_failed_node_count

ClusterName

Il numero di nodi di lavoro non riusciti nel cluster. Un nodo è considerato non riuscito se risente delle condizioni del nodo. Per ulteriori informazioni, consulta Conditions (Condizioni) nella documentazione Kubernetes.

cluster_node_count

ClusterName

Il numero totale di nodi di lavoro nel cluster.

namespace_number_of_running_pods

Namespace ClusterName

ClusterName

Il numero di pod in esecuzione per spazio dei nomi nella risorsa specificata dalle dimensioni in uso.

node_cpu_limit

ClusterName

Il numero massimo di unità di CPU che può essere assegnato a un singolo nodo nel cluster corrente.

node_cpu_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

La percentuale di unità CPU riservate per i componenti del nodo, ad esempio kubelet, kube-proxy e Docker.

Formula: node_cpu_request / node_cpu_limit

Nota

node_cpu_request non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

node_cpu_usage_total

ClusterName

Il numero di unità di CPU in uso sui nodi del cluster.

node_cpu_utilization

NodeName, ClusterName, InstanceId

ClusterName

La percentuale totale delle unità di CPU in uso sui nodi del cluster.

Formula: node_cpu_usage_total / node_cpu_limit

node_gpu_limit

ClusterName

ClusterName, InstanceId, NodeName

Il numero totale di GPU disponibili sul nodo.

node_gpu_usage_total

ClusterName

ClusterName, InstanceId, NodeName

Il numero di GPU utilizzate dai pod in esecuzione sul nodo.

node_gpu_reserved_capacity

ClusterName

ClusterName, InstanceId, NodeName

La percentuale di GPU attualmente riservata sul nodo. La formula è,node_gpu_request / node_gpu_limit.

Nota

node_gpu_request non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

node_filesystem_utilization

NodeName, ClusterName, InstanceId

ClusterName

La percentuale totale della capacità del file system in uso sui nodi del cluster.

Formula: node_filesystem_usage / node_filesystem_capacity

Nota

node_filesystem_usage e node_filesystem_capacity non vengono riportati direttamente come parametri, ma sono campi nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

node_memory_limit

ClusterName

La quantità massima di memoria, espressa in byte, che può essere assegnata a un singolo nodo nel cluster corrente.

node_memory_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

La percentuale di memoria attualmente utilizzata sui nodi del cluster.

Formula: node_memory_request / node_memory_limit

Nota

node_memory_request non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

node_memory_utilization

NodeName, ClusterName, InstanceId

ClusterName

La percentuale di memoria attualmente utilizzata dal nodo o dai nodi. È la percentuale di utilizzo della memoria del nodo rispetto alla limitazione di memoria del nodo.

Formula: node_memory_working_set / node_memory_limit.

node_memory_working_set

ClusterName

La quantità di memoria, espressa in byte, in uso nel working set dei nodi del cluster.

node_network_total_bytes

NodeName, ClusterName, InstanceId

ClusterName

Il numero totale di byte al secondo trasmessi e ricevuti tramite la rete per nodo in un cluster.

Formula: node_network_rx_bytes + node_network_tx_bytes

Nota

node_network_rx_bytes e node_network_tx_bytes non vengono riportati direttamente come parametri, ma sono campi nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

node_number_of_running_containers

NodeName, ClusterName, InstanceId

ClusterName

Il numero di container in esecuzione per nodo in un cluster.

node_number_of_running_pods

NodeName, ClusterName, InstanceId

ClusterName

Il numero di pod in esecuzione per nodo in un cluster.

pod_cpu_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

La capacità della CPU riservata per pod in un cluster.

Formula: pod_cpu_request / node_cpu_limit

Nota

pod_cpu_request non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

pod_cpu_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

La percentuale di unità CPU utilizzate dai pod.

Formula: pod_cpu_usage_total / node_cpu_limit

pod_cpu_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

La percentuale di unità CPU utilizzata dai pod relativa al limite di pod.

Formula: pod_cpu_usage_total / pod_cpu_limit

pod_gpu_request

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Le richieste GPU per il pod. Questo valore deve essere sempre uguale a. pod_gpu_limit

pod_gpu_limit

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Il numero massimo di GPU che possono essere assegnate al pod in un nodo.

pod_gpu_usage_total

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Il numero di GPU allocate sul pod.

pod_gpu_reserved_capacity

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

La percentuale di GPU attualmente riservata al pod. La formula è: pod_gpu_request/node_gpu_reserved_capacity.

pod_memory_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

La percentuale di memoria riservata per i pod.

Formula: pod_memory_request / node_memory_limit

Nota

pod_memory_request non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

pod_memory_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

La percentuale di memoria attualmente utilizzata dal pod o dai pod.

Formula: pod_memory_working_set / node_memory_limit

pod_memory_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

La percentuale di memoria utilizzata dai pod relativa al limite di pod. Se uno qualsiasi dei container nel pod non ha un limite di memoria definito, questo parametro non viene visualizzato.

Formula: pod_memory_working_set / pod_memory_limit

pod_network_rx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Il numero di byte al secondo ricevuti sulla rete dal pod.

Formula: sum(pod_interface_network_rx_bytes)

Nota

pod_interface_network_rx_bytes non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

pod_network_tx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Il numero di byte al secondo trasmessi sulla rete dal pod.

Formula: sum(pod_interface_network_tx_bytes)

Nota

pod_interface_network_tx_bytes non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.

pod_number_of_container_restarts

PodName, Namespace, ClusterName

Il numero totale di riavvii del container in un pod.

service_number_of_running_pods

Service, Namespace, ClusterName

ClusterName

Il numero di pod che eseguono il servizio o i servizi nel cluster.

Metriche Kueue

A partire dalla versione v2.4.0-eksbuild.1 del componente aggiuntivo CloudWatch Observability EKS, Container Insights for Amazon EKS supporta la raccolta di metriche Kueue dai cluster Amazon EKS. Per ulteriori informazioni sul componente aggiuntivo, consulta. Installa l' CloudWatch agente con il componente aggiuntivo Amazon CloudWatch Observability EKS o il grafico Helm

Per informazioni sull'attivazione delle metriche, consulta Abilita le metriche Kueue per abilitarle.

Le metriche Kueue raccolte sono elencate nella tabella seguente. Queste metriche vengono pubblicate nel namespace in. ContainerInsights/Prometheus CloudWatch Alcune di queste metriche utilizzano le seguenti dimensioni:

  • ClusterQueueè il nome del ClusterQueue

  • I valori possibili di Status sono active e inadmissible

  • I valori possibili di Reason sono PreemptedPodsReadyTimeout,AdmissionCheck,ClusterQueueStopped, e InactiveWorkload

  • Flavorè il sapore di riferimento.

  • Resourcesi riferisce alle risorse informatiche del cluster, ad esempio cpumemory,gpu, e così via.

Nome parametro Dimensioni Descrizione

kueue_pending_workloads

ClusterName, ClusterQueue, Status

ClusterName, ClusterQueue

ClusterName, Status

ClusterName

Il numero di carichi di lavoro in sospeso.

kueue_evicted_workloads_total

ClusterName, ClusterQueue, Reason

ClusterName, ClusterQueue

ClusterName, Reason

ClusterName

Il numero totale di carichi di lavoro eliminati.

kueue_admitted_active_workloads

ClusterName, ClusterQueue

ClusterName

Il numero di carichi di lavoro ammessi attivi (non sospesi e non completati).

kueue_cluster_queue_resource_usage

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Riporta l'utilizzo totale delle risorse di. ClusterQueue

kueue_cluster_queue_nominal_quota

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Riporta la quota di risorse di ClusterQueue.