Métricas do Amazon EKS e do Kubernetes Container Insights
As tabelas a seguir listam as métricas e as dimensões que o Container Insights coleta para o Amazon EKS e Kubernetes. Essas métricas estão no namespace ContainerInsights
. Para obter mais informações, consulte Métricas.
Se você não vir as métricas do Container Insights no seu console, certifique-se de que você tenha concluído a configuração do Container Insights. As métricas não serão exibidas até que o Container Insights tenha sido configurado completamente. Para obter mais informações, consulte Configurar o Container Insights.
Nome da métrica | Dimensões | Descrição |
---|---|---|
|
|
O número de nós do operador com falha no cluster. Um nó é considerado com falha quando apresenta qualquer condição de nó. Para obter mais informações, consulte Condições |
|
|
O número total de nós do operador no cluster. |
|
|
O número de pods em execução por namespace no recurso especificado pelas dimensões que você está usando. |
|
|
O número máximo de unidades de CPU que pode ser atribuído a um único nó neste cluster. |
|
|
A porcentagem de unidades de CPU reservadas para componentes do nó, como kubelet, kube-proxy e Docker. Fórmula: nota
|
|
|
O número de unidades da CPU que está sendo usado nos nós do cluster. |
|
|
A porcentagem total de unidades de CPU que está sendo usada nos nós do cluster. Fórmula: |
|
|
O número total de GPUs disponíveis no nó. |
|
|
O número de GPUs em uso pelos pods em execução no nó. |
|
|
A porcentagem de GPU atualmente em reserva no nó. A fórmula é nota
|
|
|
A porcentagem total da capacidade do sistema de arquivos que está sendo usado nos nós do cluster. Fórmula: nota
|
|
|
A quantidade máxima de memória, em bytes, que pode ser atribuída a um único nó neste cluster. |
|
|
A porcentagem de memória que está sendo usada no momento nos nós do cluster. Fórmula: nota
|
|
|
A porcentagem de memória que está sendo usada no momento pelo nó ou nós. É o percentual de uso de memória de nó dividido pela limitação de memória de nó. Fórmula: |
|
|
A quantidade de memória, em bytes, sendo usada no conjunto de trabalho dos nós no cluster. |
|
|
O número total de bytes transmitidos e recebidos por segundo pela rede por nó em um cluster. Fórmula: nota
|
|
|
O número de contêineres em execução por nó em um cluster. |
|
|
O número de pods em execução por nó em um cluster. |
|
|
A capacidade da CPU reservada por pod em um cluster. Fórmula: nota
|
|
|
A porcentagem de unidades de CPU que estão sendo usadas por pods. Fórmula: |
|
|
O percentual das unidades de CPU que estão sendo usadas por pods com relação ao limite de pods. Fórmula: |
|
|
As solicitações de GPU para o pod. Esse valor deve ser sempre igual a |
|
|
O número máximo de GPUs que podem ser atribuídas ao pod em um nó. |
|
|
O número de GPUs que estão sendo alocadas no pod. |
|
|
A porcentagem de GPU atualmente em reserva para o pod. A fórmula é - pod_gpu_request / node_gpu_reserved_capacity. |
|
|
A porcentagem de memória reservada para pods. Fórmula: nota
|
|
|
A porcentagem de memória que está sendo usada atualmente pelo pod ou pods. Fórmula: |
|
|
O percentual de memória que está sendo usada por pods com relação ao limite de pods. Se qualquer contêiner no pod não tiver um limite de memória definido, essa métrica não aparecerá. Fórmula: |
|
|
O número de bytes que estão sendo recebidos por segundo na rede pelo pod. Fórmula: nota
|
|
|
O número de bytes que estão sendo transmitidos por segundo na rede pelo pod. Fórmula: nota
|
|
|
O número total de reinicializações de contêineres em um pod. |
|
|
O número de pods que executam o serviço ou os serviços no cluster. |
Métricas do Kueue
A partir da versão v2.4.0-eksbuild.1
do complemento CloudWatch Observability EKS, o Container Insights para Amazon EKS coleta automaticamente as métricas do Kueue de clusters do Amazon EKS. Para obter mais informações sobre o complemento, consulte Instalação do agente do CloudWatch com o complemento de observabilidade do EKS do Amazon CloudWatch ou com o chart do Helm.
Para obter informações sobre como habilitar as métricas, consulte Habilitar métricas do Kueue para habilitá-las.
As métricas do Kueue que são coletadas estão listadas na tabela apresentada a seguir. Essas métricas são publicadas no namespace ContainerInsights/Prometheus
do CloudWatch. Para filtrar essas métricas, use as seguintes dimensões:
ClusterQueue
é o nome do ClusterQueueOs valores possíveis de
Status
sãoactive
einadmissible
Os valores possíveis de
Reason
sãoPreempted
,PodsReadyTimeout
,AdmissionCheck
,ClusterQueueStopped
eInactiveWorkload
Flavor
é o qualificador referenciado.Resource
refere-se aos recursos do computador do cluster, comocpu
,memory
,gpu
etc.
Nome da métrica | Dimensões | Descrição |
---|---|---|
|
|
O número de workloads pendentes. |
|
|
O número total de workloads removidas. |
|
|
O número de workloads admitidas que estão ativas (não suspensas e não concluídas). |
|
|
Relata o uso total de recursos do ClusterQueue. |
|
|
Relata a cota de recursos do ClusterQueue. |