Container-Insights-Metriken für Amazon EKS und Kubernetes

Die folgenden Tabellen listen die Metriken und Dimensionen auf, die von Container Insights für Amazon EKS und Kubernetes erfasst werden. Diese Metriken befinden sich im ContainerInsights-Namespace. Weitere Informationen finden Sie unter Kennzahlen.

Wenn Sie keine Container Insights-Metriken in Ihrer Konsole sehen, stellen Sie sicher, dass Sie die Einrichtung von Container Insights durchgeführt haben. Metriken werden erst angezeigt, wenn Container Insights vollständig eingerichtet wurde. Weitere Informationen finden Sie unter Einrichten von Container Insights.

Metrikname	Dimensionen	Description
`cluster_failed_node_count`	`ClusterName`	Die Anzahl der fehlgeschlagenen Workerknoten im Cluster. Ein Knoten gilt als ausgefallen, wenn er unter Knotenbedingungen leidet. Weitere Informationen finden Sie unter Bedingungen in der Kubernetes-Dokumentation.
`cluster_node_count`	`ClusterName`	Die Gesamtzahl der Workerknoten im Cluster.
`namespace_number_of_running_pods`	`Namespace` `ClusterName` `ClusterName`	Die Anzahl der Pods, die pro Namespace in der Ressource ausgeführt werden, die durch die von Ihnen verwendeten Dimensionen angegeben wird.
`node_cpu_limit`	`ClusterName`	Die maximale Anzahl der CPU-Einheiten, die einem einzelnen Knoten in diesem Cluster zugewiesen werden können.
`node_cpu_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Der Prozentsatz der CPU-Einheiten, die für Knotenkomponenten, wie z. B. kubelet, kube-proxy und Docker, reserviert sind. Formel: `node_cpu_request / node_cpu_limit` Anmerkung `node_cpu_request` wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`node_cpu_usage_total`	`ClusterName`	Die Anzahl der CPU-Einheiten, die auf den Knoten im Cluster verwendet werden.
`node_cpu_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Der Gesamtprozentsatz der CPU-Einheiten, die auf den Knoten im Cluster verwendet werden. Formel: `node_cpu_usage_total / node_cpu_limit`
`node_gpu_limit`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Die Gesamtzahl der auf dem Knoten verfügbaren GPUs.
`node_gpu_usage_total`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Die Anzahl der GPU(s), die von den laufenden Pods auf dem Knoten verwendet werden.
`node_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Der Prozentsatz der GPU-Auslastung, der derzeit auf dem Knoten reserviert ist. Die Formel lautet, `node_gpu_request / node_gpu_limit`. Anmerkung `node_gpu_request` wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`node_filesystem_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Der Gesamtprozentsatz der Dateisystemkapazität, die auf den Knoten im Cluster verwendet wird. Formel: `node_filesystem_usage / node_filesystem_capacity` Anmerkung `node_filesystem_usage` und `node_filesystem_capacity` werden nicht direkt als Metriken gemeldet, sondern sind Felder in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`node_memory_limit`	`ClusterName`	Die maximale Menge an Arbeitsspeicher in Byte, die einem einzelnen Knoten in diesem Cluster zugewiesen werden kann.
`node_memory_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Der Prozentsatz des Arbeitsspeichers, der derzeit auf den Knoten im Cluster verwendet wird. Formel: `node_memory_request / node_memory_limit` Anmerkung `node_memory_request` wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`node_memory_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Der Prozentsatz des Arbeitsspeichers, der derzeit vom Knoten oder den Knoten verwendet wird. Dies ist der Prozentsatz der Knotenspeichernutzung geteilt durch die Knotenspeicherbegrenzung. Formel: `node_memory_working_set / node_memory_limit`.
`node_memory_working_set`	`ClusterName`	Die Menge an Arbeitsspeicher in Byte, die im arbeitenden Satz der Knoten im Cluster verwendet wird.
`node_network_total_bytes`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Die Gesamtzahl der pro Knoten in einem Cluster über das Netzwerk gesendeten und empfangenen Bytes pro Sekunde. Formel: `node_network_rx_bytes + node_network_tx_bytes` Anmerkung `node_network_rx_bytes` und `node_network_tx_bytes` werden nicht direkt als Metriken gemeldet, sondern sind Felder in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`node_number_of_running_containers`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Die Anzahl der pro Knoten in einem Cluster ausgeführten Container.
`node_number_of_running_pods`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Die Anzahl der pro Knoten in einem Cluster ausgeführten Pods.
`pod_cpu_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	Die CPU-Kapazität, die pro Pod in einem Cluster reserviert ist. Formel: `pod_cpu_request / node_cpu_limit` Anmerkung `pod_cpu_request` wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`pod_cpu_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Der Prozentsatz der CPU-Einheiten, die von Pods verwendet werden. Formel: `pod_cpu_usage_total / node_cpu_limit`
`pod_cpu_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Der Prozentsatz der CPU-Einheiten, die von Pods im Verhältnis zum Pod-Limit verwendet werden. Formel: `pod_cpu_usage_total / pod_cpu_limit`
`pod_gpu_request`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Die GPU-Anforderungen für den Pod. Dieser Wert muss immer gleich `pod_gpu_limit` sein.
`pod_gpu_limit`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Die maximale Anzahl von GPU(s), die dem Pod in einem Knoten zugewiesen werden können.
`pod_gpu_usage_total`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Die Anzahl der GPU(s), die dem Pod zugewiesen wurden.
`pod_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Der Prozentsatz der GPU-Auslastung, der derzeit für den Pod reserviert ist. Die Formel lautet: - pod_gpu_request / node_gpu_reserved_capacity.
`pod_memory_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	Der Prozentsatz des Arbeitsspeichers, der für Pods reserviert ist. Formel: `pod_memory_request / node_memory_limit` Anmerkung `pod_memory_request` wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`pod_memory_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Der Prozentsatz des Arbeitsspeichers, der derzeit vom Pod oder Pods verwendet wird. Formel: `pod_memory_working_set / node_memory_limit`
`pod_memory_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Der Prozentsatz des Arbeitsspeichers, der von den Pods im Verhältnis zum Pod-Limit verwendet wird. Wenn für keinen der Container im Pod ein Speicherlimit definiert ist, wird diese Metrik nicht angezeigt. Formel: `pod_memory_working_set / pod_memory_limit`
`pod_network_rx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Die Anzahl der Bytes pro Sekunde, die vom Pod über das Netzwerk empfangen werden. Formel: `sum(pod_interface_network_rx_bytes)` Anmerkung `pod_interface_network_rx_bytes` wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`pod_network_tx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Die Anzahl der Bytes pro Sekunde, die vom Pod über das Netzwerk übertragen werden. Formel: `sum(pod_interface_network_tx_bytes)` Anmerkung `pod_interface_network_tx_bytes` wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.
`pod_number_of_container_restarts`	`PodName`, `Namespace`, `ClusterName`	Die Gesamtanzahl der Container-Neustarts in einem Pod.
`service_number_of_running_pods`	`Service`, `Namespace`, `ClusterName` `ClusterName`	Die Anzahl der Pods, von denen der Service oder die Services im Cluster ausgeführt werden.

Kueue-Metriken

Ab v2.4.0-eksbuild.1 der Version des CloudWatch Observability EKS-Add-ons unterstützt Container Insights for Amazon EKS die Erfassung von Kueue-Metriken aus Amazon EKS-Clustern. Weitere Informationen zu den Add-Ons finden Sie unter Installieren Sie den CloudWatch Agenten mit dem Amazon CloudWatch Observability EKS-Add-on oder dem Helm-Diagramm.

Weitere Informationen zum Aktivieren der Metriken finden Sie unter Aktivieren von Kueue-Metriken für deren Aktivierung.

Die Kueue-Metriken, die erfasst werden, sind in der folgenden Tabelle aufgeführt. Diese Metriken werden im ContainerInsights/Prometheus Namespace in veröffentlicht. CloudWatch Einige dieser Metriken verwenden die folgenden Dimensionen:

ClusterQueueist der Name des ClusterQueue
Die möglichen Werte von Status sind active und inadmissible
Die möglichen Werte für Reason sind Preempted, PodsReadyTimeout, AdmissionCheck, ClusterQueueStopped und InactiveWorkload
Flavor ist die referenzierte Variante.
Resource bezieht sich auf Cluster-Computerressourcen wie cpu, memory, gpu usw.

Metrikname	Dimensionen	Description
`kueue_pending_workloads`	`ClusterName`, `ClusterQueue`, `Status` `ClusterName`, `ClusterQueue` `ClusterName`, `Status` `ClusterName`	Die Anzahl der ausstehenden Workloads.
`kueue_evicted_workloads_total`	`ClusterName`, `ClusterQueue`, `Reason` `ClusterName`, `ClusterQueue` `ClusterName`, `Reason` `ClusterName`	Die Gesamtzahl der bereinigten Workloads.
`kueue_admitted_active_workloads`	`ClusterName`, `ClusterQueue` `ClusterName`	Die Anzahl der zugelassenen Workloads, die aktiv sind (nicht ausgesetzt und nicht abgeschlossen).
`kueue_cluster_queue_resource_usage`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Meldet den gesamten Ressourcenverbrauch von ClusterQueue.
`kueue_cluster_queue_nominal_quota`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Meldet das Ressourcenkontingent von ClusterQueue.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Container-Insights-Metriken mit verbesserter Beobachtbarkeit für Amazon EKS und Kubernetes

Referenz zu Leistungsprotokollen

Container-Insights-Metriken für Amazon EKS und Kubernetes

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Anmerkung

Kueue-Metriken