Container-Insights-Metriken für Amazon EKS und Kubernetes - Amazon CloudWatch

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Container-Insights-Metriken für Amazon EKS und Kubernetes

In den folgenden Tabellen sind die Metriken und Dimensionen aufgeführt, die Container Insights für Amazon EKS und Kubernetes erfasst. Diese Metriken befinden sich im ContainerInsights-Namespace. Weitere Informationen finden Sie unter Metriken.

Wenn Sie keine Container Insights-Metriken in Ihrer Konsole sehen, stellen Sie sicher, dass Sie die Einrichtung von Container Insights durchgeführt haben. Metriken werden erst angezeigt, wenn Container Insights vollständig eingerichtet wurde. Weitere Informationen finden Sie unter Einrichten von Container Insights.

Metrikname Dimensionen Beschreibung

cluster_failed_node_count

ClusterName

Die Anzahl der fehlgeschlagenen Workerknoten im Cluster. Ein Knoten gilt als ausgefallen, wenn er unter Knotenbedingungen leidet. Weitere Informationen finden Sie unter Bedingungen in der Kubernetes-Dokumentation.

cluster_node_count

ClusterName

Die Gesamtzahl der Workerknoten im Cluster.

namespace_number_of_running_pods

Namespace ClusterName

ClusterName

Die Anzahl der Pods, die pro Namespace in der Ressource ausgeführt werden, die durch die von Ihnen verwendeten Dimensionen angegeben wird.

node_cpu_limit

ClusterName

Die maximale Anzahl der CPU-Einheiten, die einem einzelnen Knoten in diesem Cluster zugewiesen werden können.

node_cpu_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

Der Prozentsatz der CPU-Einheiten, die für Knotenkomponenten, wie z. B. kubelet, kube-proxy und Docker, reserviert sind.

Formel: node_cpu_request / node_cpu_limit

Anmerkung

node_cpu_request wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

node_cpu_usage_total

ClusterName

Die Anzahl der CPU-Einheiten, die auf den Knoten im Cluster verwendet werden.

node_cpu_utilization

NodeName, ClusterName, InstanceId

ClusterName

Der Gesamtprozentsatz der CPU-Einheiten, die auf den Knoten im Cluster verwendet werden.

Formel: node_cpu_usage_total / node_cpu_limit

node_gpu_limit

ClusterName

ClusterName, InstanceId, NodeName

Die Gesamtzahl der auf dem Knoten verfügbaren GPU (s).

node_gpu_usage_total

ClusterName

ClusterName, InstanceId, NodeName

Die Anzahl der GPU (s), die von den laufenden Pods auf dem Knoten verwendet werden.

node_gpu_reserved_capacity

ClusterName

ClusterName, InstanceId, NodeName

Der Prozentsatz der GPU, die derzeit auf dem Knoten reserviert ist. Die Formel lautet,node_gpu_request / node_gpu_limit.

Anmerkung

node_gpu_request wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

node_filesystem_utilization

NodeName, ClusterName, InstanceId

ClusterName

Der Gesamtprozentsatz der Dateisystemkapazität, die auf den Knoten im Cluster verwendet wird.

Formel: node_filesystem_usage / node_filesystem_capacity

Anmerkung

node_filesystem_usage und node_filesystem_capacity werden nicht direkt als Metriken gemeldet, sondern sind Felder in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

node_memory_limit

ClusterName

Die maximale Menge an Arbeitsspeicher in Byte, die einem einzelnen Knoten in diesem Cluster zugewiesen werden kann.

node_memory_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

Der Prozentsatz des Arbeitsspeichers, der derzeit auf den Knoten im Cluster verwendet wird.

Formel: node_memory_request / node_memory_limit

Anmerkung

node_memory_request wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

node_memory_utilization

NodeName, ClusterName, InstanceId

ClusterName

Der Prozentsatz des Arbeitsspeichers, der derzeit vom Knoten oder den Knoten verwendet wird. Dies ist der Prozentsatz der Knotenspeichernutzung geteilt durch die Knotenspeicherbegrenzung.

Formel: node_memory_working_set / node_memory_limit.

node_memory_working_set

ClusterName

Die Menge an Arbeitsspeicher in Byte, die im arbeitenden Satz der Knoten im Cluster verwendet wird.

node_network_total_bytes

NodeName, ClusterName, InstanceId

ClusterName

Die Gesamtzahl der pro Knoten in einem Cluster über das Netzwerk gesendeten und empfangenen Bytes pro Sekunde.

Formel: node_network_rx_bytes + node_network_tx_bytes

Anmerkung

node_network_rx_bytes und node_network_tx_bytes werden nicht direkt als Metriken gemeldet, sondern sind Felder in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

node_number_of_running_containers

NodeName, ClusterName, InstanceId

ClusterName

Die Anzahl der pro Knoten in einem Cluster ausgeführten Container.

node_number_of_running_pods

NodeName, ClusterName, InstanceId

ClusterName

Die Anzahl der pro Knoten in einem Cluster ausgeführten Pods.

pod_cpu_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

Die CPU-Kapazität, die pro Pod in einem Cluster reserviert ist.

Formel: pod_cpu_request / node_cpu_limit

Anmerkung

pod_cpu_request wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

pod_cpu_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Der Prozentsatz der CPU-Einheiten, die von Pods verwendet werden.

Formel: pod_cpu_usage_total / node_cpu_limit

pod_cpu_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Der Prozentsatz der CPU-Einheiten, die von Pods im Verhältnis zum Pod-Limit verwendet werden.

Formel: pod_cpu_usage_total / pod_cpu_limit

pod_gpu_request

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Die GPU-Anfragen für den Pod. Dieser Wert muss immer gleich seinpod_gpu_limit.

pod_gpu_limit

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Die maximale Anzahl von GPU (s), die dem Pod in einem Knoten zugewiesen werden können.

pod_gpu_usage_total

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Die Anzahl der GPU (s), die dem Pod zugewiesen wurden.

pod_gpu_reserved_capacity

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Der Prozentsatz der GPU, die derzeit für den Pod reserviert ist. Die Formel lautet: pod_gpu_request /node_gpu_reserved_capacity.

pod_memory_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

Der Prozentsatz des Arbeitsspeichers, der für Pods reserviert ist.

Formel: pod_memory_request / node_memory_limit

Anmerkung

pod_memory_request wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

pod_memory_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Der Prozentsatz des Arbeitsspeichers, der derzeit vom Pod oder Pods verwendet wird.

Formel: pod_memory_working_set / node_memory_limit

pod_memory_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Der Prozentsatz des Arbeitsspeichers, der von den Pods im Verhältnis zum Pod-Limit verwendet wird. Wenn für keinen der Container im Pod ein Speicherlimit definiert ist, wird diese Metrik nicht angezeigt.

Formel: pod_memory_working_set / pod_memory_limit

pod_network_rx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Die Anzahl der Bytes pro Sekunde, die vom Pod über das Netzwerk empfangen werden.

Formel: sum(pod_interface_network_rx_bytes)

Anmerkung

pod_interface_network_rx_bytes wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

pod_network_tx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Die Anzahl der Bytes pro Sekunde, die vom Pod über das Netzwerk übertragen werden.

Formel: sum(pod_interface_network_tx_bytes)

Anmerkung

pod_interface_network_tx_bytes wird nicht direkt als Metrik gemeldet, sondern ist ein Feld in Leistungsprotokoll-Ereignissen. Weitere Informationen finden Sie unter Relevante Felder in Performance-Protokollereignissen für Amazon EKS und Kubernetes.

pod_number_of_container_restarts

PodName, Namespace, ClusterName

Die Gesamtanzahl der Container-Neustarts in einem Pod.

service_number_of_running_pods

Service, Namespace, ClusterName

ClusterName

Die Anzahl der Pods, von denen der Service oder die Services im Cluster ausgeführt werden.

Metriken für die Warteschlange

Ab v2.4.0-eksbuild.1 der Version des CloudWatch Observability EKS-Add-ons unterstützt Container Insights for Amazon EKS die Erfassung von Kueue-Metriken aus Amazon EKS-Clustern. Weitere Informationen über das Add-on finden Sie unter. Installieren Sie den CloudWatch Agenten mit dem Amazon CloudWatch Observability EKS-Add-on oder dem Helm-Diagramm

Informationen zur Aktivierung der Metriken finden Sie unter Aktivieren Sie Warteschlangen-Metriken So aktivieren Sie sie.

Die gesammelten Kueue-Metriken sind in der folgenden Tabelle aufgeführt. Diese Metriken werden im ContainerInsights/Prometheus Namespace in veröffentlicht. CloudWatch Einige dieser Metriken verwenden die folgenden Dimensionen:

  • ClusterQueueist der Name des ClusterQueue

  • Die möglichen Werte von Status sind active und inadmissible

  • Die möglichen Werte von Reason sind PreemptedPodsReadyTimeout,AdmissionCheck,ClusterQueueStopped, und InactiveWorkload

  • Flavorist der Flavor, auf den verwiesen wird.

  • Resourcebezieht sich auf Cluster-Computerressourcen wie cpu memorygpu,, usw.

Metrikname Dimensionen Beschreibung

kueue_pending_workloads

ClusterName, ClusterQueue, Status

ClusterName, ClusterQueue

ClusterName, Status

ClusterName

Die Anzahl der ausstehenden Workloads.

kueue_evicted_workloads_total

ClusterName, ClusterQueue, Reason

ClusterName, ClusterQueue

ClusterName, Reason

ClusterName

Die Gesamtzahl der gelöschten Workloads.

kueue_admitted_active_workloads

ClusterName, ClusterQueue

ClusterName

Die Anzahl der zugelassenen Workloads, die aktiv sind (nicht ausgesetzt und noch nicht abgeschlossen).

kueue_cluster_queue_resource_usage

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Meldet die gesamte Ressourcennutzung von. ClusterQueue

kueue_cluster_queue_nominal_quota

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Meldet das Ressourcenkontingent von ClusterQueue.