Metrik-metrik Wawasan Kontainer Amazon EKS dan Kubernetes

Tabel berikut mencantumkan metrik dan dimensi yang dikumpulkan Container Insights untuk Amazon EKS dan Kubernetes. Metrik-metrik ini berada di namespace ContainerInsights. Untuk informasi selengkapnya, lihat Metrik-metrik.

Jika Anda tidak melihat metrik Wawasan Kontainer di konsol Anda, maka Anda harus memastikan bahwa telah menyelesaikan penyiapan Wawasan Kontainer. Metrik tidak akan ditampilkan sebelum Wawasan Kontainer telah disiapkan sepenuhnya. Untuk informasi selengkapnya, lihat Menyiapkan Wawasan Kontainer.

Nama metrik	Dimensi	Deskripsi
`cluster_failed_node_count`	`ClusterName`	Jumlah simpul pekerja yang mengalami kegagalan dalam klaster. Sebuah simpul dianggap mengalami kegagalan jika mengalami kondisi simpul apa pun. Untuk informasi selengkapnya tentang hal itu, silakan lihat Kondisi dalam dokumentasi Kubernetes.
`cluster_node_count`	`ClusterName`	Jumlah total simpul pekerja yang ada di klaster.
`namespace_number_of_running_pods`	`Namespace` `ClusterName` `ClusterName`	Jumlah pod yang berjalan untuk masing-masing namespace dalam sumber daya yang ditentukan oleh dimensi-dimensi yang sedang Anda gunakan.
`node_cpu_limit`	`ClusterName`	Jumlah maksimum unit CPU yang dapat ditetapkan untuk satu simpul tunggal dalam klaster ini.
`node_cpu_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Persentase unit CPU yang dicadangkan untuk komponen-komponen simpul, seperti kubelet, kube-proxy, dan Docker. Rumus: `node_cpu_request / node_cpu_limit` catatan `node_cpu_request` tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`node_cpu_usage_total`	`ClusterName`	Jumlah unit CPU yang sedang digunakan pada simpul di klaster.
`node_cpu_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Persentase total unit CPU yang sedang digunakan pada simpul di klaster. Rumus: `node_cpu_usage_total / node_cpu_limit`
`node_gpu_limit`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Jumlah total GPU (s) yang tersedia pada node.
`node_gpu_usage_total`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Jumlah GPU yang digunakan oleh pod yang sedang berjalan pada node.
`node_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Persentase GPU saat ini sedang dicadangkan di node. Rumusnya adalah,`node_gpu_request / node_gpu_limit`. catatan `node_gpu_request` tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`node_filesystem_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Persentase total kapasitas sistem file yang sedang digunakan pada satu simpul tunggal dalam klaster. Rumus: `node_filesystem_usage / node_filesystem_capacity` catatan `node_filesystem_usage` dan `node_filesystem_capacity` tidak akan dilaporkan secara langsung sebagai metrik, tetapi sebagai bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`node_memory_limit`	`ClusterName`	Jumlah memori maksimum, dalam byte, yang dapat ditetapkan ke satu simpul tunggal dalam klaster ini.
`node_memory_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Persentase memori yang saat ini sedang digunakan pada simpul di klaster. Rumus: `node_memory_request / node_memory_limit` catatan `node_memory_request` tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`node_memory_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Persentase memori yang saat ini sedang digunakan oleh simpul atau simpul-simpul tersebut. Ini adalah persentase penggunaan memori simpul yang dibagi dengan batasan memori simpul. Rumus: `node_memory_working_set / node_memory_limit`.
`node_memory_working_set`	`ClusterName`	Jumlah memori, dalam byte, yang sedang digunakan dalam serangkaian simpul dalam klaster.
`node_network_total_bytes`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Jumlah total byte per detik yang ditransmisikan dan diterima melalui jaringan untuk setiap simpul dalam sebuah klaster. Rumus: `node_network_rx_bytes + node_network_tx_bytes` catatan `node_network_rx_bytes` dan `node_network_tx_bytes` tidak akan dilaporkan secara langsung sebagai metrik, tetapi sebagai bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`node_number_of_running_containers`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Jumlah kontainer yang sedang berjalan untuk setiap simpul dalam sebuah klaster.
`node_number_of_running_pods`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Jumlah pod yang sedang berjalan untuk setiap simpul dalam sebuah klaster.
`pod_cpu_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	Kapasitas CPU yang dicadangkan untuk setiap pod dalam sebuah klaster. Rumus: `pod_cpu_request / node_cpu_limit` catatan `pod_cpu_request` tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`pod_cpu_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Persentase unit CPU yang sedang digunakan oleh pod. Rumus: `pod_cpu_usage_total / node_cpu_limit`
`pod_cpu_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Persentase unit CPU yang sedang digunakan oleh pod relatif terhadap batas pod. Rumus: `pod_cpu_usage_total / pod_cpu_limit`
`pod_gpu_request`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Permintaan GPU untuk pod. Nilai ini harus selalu sama dengan`pod_gpu_limit`.
`pod_gpu_limit`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Jumlah maksimum GPU yang dapat ditetapkan ke pod dalam sebuah node.
`pod_gpu_usage_total`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Jumlah GPU yang dialokasikan pada pod.
`pod_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Persentase GPU saat ini sedang dicadangkan untuk pod. Rumusnya adalah - pod_gpu_request/node_gpu_reserved_capacity.
`pod_memory_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	Persentase memori yang dicadangkan untuk pod. Rumus: `pod_memory_request / node_memory_limit` catatan `pod_memory_request` tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`pod_memory_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Persentase memori yang saat ini sedang digunakan oleh satu pod atau banyak pod. Rumus: `pod_memory_working_set / node_memory_limit`
`pod_memory_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Persentase memori yang sedang digunakan oleh pod relatif terhadap batas pod. Jika ada kontainer di dalam pod yang tidak memiliki batas memori yang ditentukan, metrik ini tidak akan ditampilkan. Rumus: `pod_memory_working_set / pod_memory_limit`
`pod_network_rx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Jumlah byte per detik yang sedang diterima melalui jaringan oleh pod. Rumus: `sum(pod_interface_network_rx_bytes)` catatan `pod_interface_network_rx_bytes` tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`pod_network_tx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Jumlah byte per detik yang sedang ditransmisikan melalui jaringan oleh pod. Rumus: `sum(pod_interface_network_tx_bytes)` catatan `pod_interface_network_tx_bytes` tidak dilaporkan secara langsung sebagai sebuah metrik, tetapi merupakan sebuah bidang dalam peristiwa log performa. Untuk informasi selengkapnya, lihat Bidang-bidang relevan dalam peristiwa log performa untuk Amazon EKS dan Kubernetes.
`pod_number_of_container_restarts`	`PodName`, `Namespace`, `ClusterName`	Jumlah total kontainer yang memulai ulang di sebuah pod.
`service_number_of_running_pods`	`Service`, `Namespace`, `ClusterName` `ClusterName`	Jumlah pod yang menjalankan satu layanan atau banyak layanan di klaster.

Metrik Kueue

Dimulai dengan versi v2.4.0-eksbuild.1 add-on CloudWatch Observability EKS, Container Insights untuk Amazon EKS mendukung pengumpulan metrik Kueue dari kluster Amazon EKS. Untuk informasi selengkapnya tentang add-on, lihatInstal CloudWatch agen dengan add-on Amazon CloudWatch Observability EKS atau bagan Helm.

Untuk informasi tentang mengaktifkan metrik, lihat Aktifkan metrik Kueue untuk mengaktifkannya.

Metrik Kueue yang dikumpulkan tercantum dalam tabel berikut. Metrik ini dipublikasikan ke ContainerInsights/Prometheus namespace di. CloudWatch Beberapa metrik ini menggunakan dimensi berikut:

ClusterQueueadalah nama dari ClusterQueue
Nilai yang mungkin dari Status adalah active dan inadmissible
Nilai yang mungkin dari Reason adalahPreempted,PodsReadyTimeout,AdmissionCheck,ClusterQueueStopped, dan InactiveWorkload
Flavoradalah rasa yang direferensikan.
Resourcemengacu pada sumber daya komputer cluster, seperti cpumemory,gpu,, dan sebagainya.

Nama metrik	Dimensi	Deskripsi
`kueue_pending_workloads`	`ClusterName`, `ClusterQueue`, `Status` `ClusterName`, `ClusterQueue` `ClusterName`, `Status` `ClusterName`	Jumlah beban kerja yang tertunda.
`kueue_evicted_workloads_total`	`ClusterName`, `ClusterQueue`, `Reason` `ClusterName`, `ClusterQueue` `ClusterName`, `Reason` `ClusterName`	Jumlah total beban kerja yang diusir.
`kueue_admitted_active_workloads`	`ClusterName`, `ClusterQueue` `ClusterName`	Jumlah beban kerja yang diterima yang aktif (tidak ditangguhkan dan belum selesai).
`kueue_cluster_queue_resource_usage`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Melaporkan total penggunaan sumber daya dari ClusterQueue.
`kueue_cluster_queue_nominal_quota`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Melaporkan kuota sumber daya dari. ClusterQueue

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Amazon EKS dan Kubernetes Container Insights dengan metrik observabilitas yang disempurnakan

Referensi log performa

Metrik-metrik Wawasan Kontainer Amazon EKS dan Kubernetes

catatan

catatan

catatan

catatan

catatan

catatan

catatan

catatan

catatan

Metrik Kueue