Metrik-metrik Wawasan Kontainer Amazon EKS dan Kubernetes - Amazon CloudWatch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Metrik-metrik Wawasan Kontainer Amazon EKS dan Kubernetes

Tabel berikut mencantumkan metrik dan dimensi yang dikumpulkan Container Insights untuk Amazon EKS dan Kubernetes. Metrik-metrik ini berada di namespace ContainerInsights. Untuk informasi selengkapnya, lihat Metrik.

Jika Anda tidak melihat metrik Wawasan Kontainer di konsol Anda, maka Anda harus memastikan bahwa telah menyelesaikan penyiapan Wawasan Kontainer. Metrik tidak akan ditampilkan sebelum Wawasan Kontainer telah disiapkan sepenuhnya. Untuk informasi selengkapnya, lihat Menyiapkan Wawasan Kontainer.

Nama metrik Dimensi Deskripsi

cluster_failed_node_count

ClusterName

Jumlah simpul pekerja yang mengalami kegagalan dalam klaster. Sebuah simpul dianggap mengalami kegagalan jika mengalami kondisi simpul apa pun. Untuk informasi selengkapnya tentang hal itu, silakan lihat Kondisi dalam dokumentasi Kubernetes.

cluster_node_count

ClusterName

Jumlah total simpul pekerja yang ada di klaster.

namespace_number_of_running_pods

Namespace ClusterName

ClusterName

Jumlah pod yang berjalan untuk masing-masing namespace dalam sumber daya yang ditentukan oleh dimensi-dimensi yang sedang Anda gunakan.

node_cpu_limit

ClusterName

Jumlah maksimum unit CPU yang dapat ditetapkan untuk satu simpul tunggal dalam klaster ini.

node_cpu_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

Persentase unit CPU yang dicadangkan untuk komponen-komponen simpul, seperti kubelet, kube-proxy, dan Docker.

Rumus: node_cpu_request / node_cpu_limit

catatan

node_cpu_request tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

node_cpu_usage_total

ClusterName

Jumlah unit CPU yang sedang digunakan pada simpul di klaster.

node_cpu_utilization

NodeName, ClusterName, InstanceId

ClusterName

Persentase total unit CPU yang sedang digunakan pada simpul di klaster.

Rumus: node_cpu_usage_total / node_cpu_limit

node_gpu_limit

ClusterName

ClusterName, InstanceId, NodeName

Jumlah total GPU (s) yang tersedia pada node.

node_gpu_usage_total

ClusterName

ClusterName, InstanceId, NodeName

Jumlah GPU yang digunakan oleh pod yang sedang berjalan pada node.

node_gpu_reserved_capacity

ClusterName

ClusterName, InstanceId, NodeName

Persentase GPU saat ini sedang dicadangkan di node. Rumusnya adalah, node_gpu_request / node_gpu_limit

catatan

node_gpu_request tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

node_filesystem_utilization

NodeName, ClusterName, InstanceId

ClusterName

Persentase total kapasitas sistem file yang sedang digunakan pada satu simpul tunggal dalam klaster.

Rumus: node_filesystem_usage / node_filesystem_capacity

catatan

node_filesystem_usage dan node_filesystem_capacity tidak akan dilaporkan secara langsung sebagai metrik, tetapi sebagai bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

node_memory_limit

ClusterName

Jumlah memori maksimum, dalam byte, yang dapat ditetapkan ke satu simpul tunggal dalam klaster ini.

node_memory_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

Persentase memori yang saat ini sedang digunakan pada simpul di klaster.

Rumus: node_memory_request / node_memory_limit

catatan

node_memory_request tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

node_memory_utilization

NodeName, ClusterName, InstanceId

ClusterName

Persentase memori yang saat ini sedang digunakan oleh simpul atau simpul-simpul tersebut. Ini adalah persentase penggunaan memori simpul yang dibagi dengan batasan memori simpul.

Rumus: node_memory_working_set / node_memory_limit.

node_memory_working_set

ClusterName

Jumlah memori, dalam byte, yang sedang digunakan dalam serangkaian simpul dalam klaster.

node_network_total_bytes

NodeName, ClusterName, InstanceId

ClusterName

Jumlah total byte per detik yang ditransmisikan dan diterima melalui jaringan untuk setiap simpul dalam sebuah klaster.

Rumus: node_network_rx_bytes + node_network_tx_bytes

catatan

node_network_rx_bytes dan node_network_tx_bytes tidak akan dilaporkan secara langsung sebagai metrik, tetapi sebagai bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

node_number_of_running_containers

NodeName, ClusterName, InstanceId

ClusterName

Jumlah kontainer yang sedang berjalan untuk setiap simpul dalam sebuah klaster.

node_number_of_running_pods

NodeName, ClusterName, InstanceId

ClusterName

Jumlah pod yang sedang berjalan untuk setiap simpul dalam sebuah klaster.

pod_cpu_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

Kapasitas CPU yang dicadangkan untuk setiap pod dalam sebuah klaster.

Rumus: pod_cpu_request / node_cpu_limit

catatan

pod_cpu_request tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

pod_cpu_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Persentase unit CPU yang sedang digunakan oleh pod.

Rumus: pod_cpu_usage_total / node_cpu_limit

pod_cpu_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Persentase unit CPU yang sedang digunakan oleh pod relatif terhadap batas pod.

Rumus: pod_cpu_usage_total / pod_cpu_limit

pod_gpu_request

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Permintaan GPU untuk pod. Nilai ini harus selalu sama denganpod_gpu_limit.

pod_gpu_limit

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Jumlah maksimum GPU yang dapat ditetapkan ke pod dalam sebuah node.

pod_gpu_usage_total

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Jumlah GPU yang dialokasikan pada pod.

pod_gpu_reserved_capacity

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Persentase GPU saat ini sedang dicadangkan untuk pod. Rumusnya adalah - pod_gpu_request/node_gpu_reserved_capacity.

pod_memory_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

Persentase memori yang dicadangkan untuk pod.

Rumus: pod_memory_request / node_memory_limit

catatan

pod_memory_request tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

pod_memory_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Persentase memori yang saat ini sedang digunakan oleh satu pod atau banyak pod.

Rumus: pod_memory_working_set / node_memory_limit

pod_memory_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Persentase memori yang sedang digunakan oleh pod relatif terhadap batas pod. Jika ada kontainer di dalam pod yang tidak memiliki batas memori yang ditentukan, metrik ini tidak akan ditampilkan.

Rumus: pod_memory_working_set / pod_memory_limit

pod_network_rx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Jumlah byte per detik yang sedang diterima melalui jaringan oleh pod.

Rumus: sum(pod_interface_network_rx_bytes)

catatan

pod_interface_network_rx_bytes tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

pod_network_tx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

Jumlah byte per detik yang sedang ditransmisikan melalui jaringan oleh pod.

Rumus: sum(pod_interface_network_tx_bytes)

catatan

pod_interface_network_tx_bytes tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.

pod_number_of_container_restarts

PodName, Namespace, ClusterName

Jumlah total kontainer yang memulai ulang di sebuah pod.

service_number_of_running_pods

Service, Namespace, ClusterName

ClusterName

Jumlah pod yang menjalankan satu layanan atau banyak layanan di klaster.

Metrik Kueue

Dimulai dengan versi v2.4.0-eksbuild.1 add-on CloudWatch Observability EKS, Container Insights untuk Amazon EKS mendukung pengumpulan metrik Kueue dari kluster Amazon EKS. Untuk informasi selengkapnya tentang add-on, lihatInstal CloudWatch agen dengan add-on Amazon CloudWatch Observability EKS atau bagan Helm.

Untuk informasi tentang mengaktifkan metrik, lihat Aktifkan metrik Kueue untuk mengaktifkannya.

Metrik Kueue yang dikumpulkan tercantum dalam tabel berikut. Metrik ini dipublikasikan ke ContainerInsights/Prometheus namespace di. CloudWatch Beberapa metrik ini menggunakan dimensi berikut:

  • ClusterQueueadalah nama dari ClusterQueue

  • Nilai yang mungkin dari Status adalah active dan inadmissible

  • Nilai yang mungkin dari Reason adalahPreempted,PodsReadyTimeout,AdmissionCheck,ClusterQueueStopped, dan InactiveWorkload

  • Flavoradalah rasa yang direferensikan.

  • Resourcemengacu pada sumber daya komputer cluster, seperti cpumemory,gpu,, dan sebagainya.

Nama metrik Dimensi Deskripsi

kueue_pending_workloads

ClusterName, ClusterQueue, Status

ClusterName, ClusterQueue

ClusterName, Status

ClusterName

Jumlah beban kerja yang tertunda.

kueue_evicted_workloads_total

ClusterName, ClusterQueue, Reason

ClusterName, ClusterQueue

ClusterName, Reason

ClusterName

Jumlah total beban kerja yang diusir.

kueue_admitted_active_workloads

ClusterName, ClusterQueue

ClusterName

Jumlah beban kerja yang diterima yang aktif (tidak ditangguhkan dan belum selesai).

kueue_cluster_queue_resource_usage

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Melaporkan total penggunaan sumber daya dari ClusterQueue.

kueue_cluster_queue_nominal_quota

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Melaporkan kuota sumber daya dari. ClusterQueue