Métricas do Amazon MSK para monitorar agentes Express com o CloudWatch - Amazon Managed Streaming for Apache Kafka

Métricas do Amazon MSK para monitorar agentes Express com o CloudWatch

O Amazon MSK tem integração com o CloudWatch para que você possa coletar, visualizar e analisar métricas do CloudWatch dos seus agentes Express do MSK. As métricas que você configurou para o cluster do MSK Provisioned são coletadas e enviadas automaticamente para o CloudWatch em intervalos de um minuto. Você pode definir o nível de monitoramento de um cluster do MSK Provisioned como um dos seguintes: DEFAULT, PER_BROKER, PER_TOPIC_PER_BROKER ou PER_TOPIC_PER_PARTITION. As tabelas nas seções a seguir mostram as métricas disponíveis em cada nível de monitoramento.

As métricas no nível DEFAULT são gratuitas. Os preços de outras métricas estão descritos na página Preços do Amazon CloudWatch.

Monitoramento de nível DEFAULT para agentes Express

As métricas descritas na tabela a seguir estão disponíveis gratuitamente no nível de monitoramento DEFAULT.

Nome Quando visível Dimensões Descrição

ActiveControllerCount

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster

Somente um controlador por cluster deve estar ativo em qualquer momento.

BytesInPerSec

Depois de criar um tópico.

Nome do cluster, ID do agente, tópico

O número de bytes por segundo recebidos dos clientes. Essa métrica está disponível por agente e também por tópico.

BytesOutPerSec

Depois de criar um tópico.

Nome do cluster, ID do agente, tópico

O número de bytes por segundo enviados aos clientes. Essa métrica está disponível por agente e também por tópico.

ClientConnectionCount

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente, autenticação de cliente

O número de conexões de cliente autenticadas e ativas.

ConnectionCount

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número de conexões ativas autenticadas, não autenticadas e entre agentes.

CpuIdle

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

A porcentagem de tempo ocioso da CPU.

CpuSystem

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

A porcentagem de CPU no espaço do kernel.

CpuUser

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

A porcentagem de CPU no espaço do usuário.

GlobalPartitionCount

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster

O número de partições em todos os tópicos no cluster, excluindo réplicas. Como GlobalPartitionCount não inclui réplicas, a soma dos valores de PartitionCount pode ser maior que GlobalPartitionCount se o fator de replicação de um tópico for maior que 1.

GlobalTopicCount

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster

Número total de tópicos em todos os agentes no cluster.

EstimatedMaxTimeLag

Depois que o grupo de consumidores consome de um tópico.

Grupo de consumidores, tópico

Estimativa de tempo (em segundos) para drenar MaxOffsetLag.

LeaderCount

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número total de líderes de partições por agente, sem incluir réplicas.

MaxOffsetLag

Depois que o grupo de consumidores consome de um tópico.

Grupo de consumidores, tópico

O atraso máximo de deslocamento entre todas as partições em um tópico.

MemoryBuffered

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O tamanho, em bytes, da memória armazenada em buffer para o agente.

MemoryCached

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O tamanho, em bytes, da memória armazenada em cache para o agente.

MemoryFree

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O tamanho, em bytes, de memória que é gratuita e disponível para o agente.

MemoryUsed

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O tamanho, em bytes, de memória que está em uso pelo agente.

MessagesInPerSec

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número de mensagens recebidas por segundo do agente.

NetworkRxDropped

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número de pacotes de recebimento descartados.

NetworkRxErrors

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número de erros de recepção da rede para o agente.

NetworkRxPackets

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número de pacotes recebidos pelo agente.

NetworkTxDropped

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número de pacotes de transmissão descartados.

NetworkTxErrors

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número de erros de transmissão da rede para o agente.

NetworkTxPackets

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número de pacotes transmitidos pelo agente.

PartitionCount

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número total de partições de tópico por agente, incluindo réplicas.

ProduceTotalTimeMsMean

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O tempo médio de produção em milissegundos.

RequestBytesMean

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

O número médio de bytes de solicitações do agente.

RequestTime

Após o controle de utilização da solicitação ser aplicado.

Nome do cluster, ID do agente

O tempo médio gasto em milissegundos em threads de rede e de E/S do agente para processar solicitações.

StorageUsed Depois que o cluster passa para o estado ACTIVE. Nome do cluster O total de partições em todos os tópicos no cluster, excluindo réplicas.

SumOffsetLag

Depois que o grupo de consumidores consome de um tópico.

Grupo de consumidores, tópico

O atraso de deslocamento agregado para todas as partições em um tópico.

UserPartitionExists

Depois que o cluster passa para o estado ACTIVE.

Nome do cluster, ID do agente

Métrica booleana que indica a presença de uma partição de propriedade do usuário em um agente. O valor 1 indica a presença de partições no agente.

Monitoramento de nível PER_BROKER para agentes Express

Ao definir o nível de monitoramento como PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas de nível DEFAULT. Você paga pelas métricas de acordo com a tabela a seguir, enquanto as métricas de nível DEFAULT continuam gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente.

Nome Quando visível Descrição

ConnectionCloseRate

Depois que o cluster passa para o estado ACTIVE.

O número de conexões fechadas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente.

ConnectionCreationRate

Depois que o cluster passa para o estado ACTIVE.

O número de novas conexões estabelecidas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente.

FetchConsumerLocalTimeMsMean

Depois de haver um produtor/consumidor.

O tempo médio em milissegundos que a solicitação do consumidor é processada no líder.

FetchConsumerRequestQueueTimeMsMean

Depois de haver um produtor/consumidor.

O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de solicitações.

FetchConsumerResponseQueueTimeMsMean

Depois de haver um produtor/consumidor.

O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de resposta.

FetchConsumerResponseSendTimeMsMean

Depois de haver um produtor/consumidor.

O tempo médio, em milissegundos, para que o consumidor envie uma resposta.

FetchConsumerTotalTimeMsMean

Depois de haver um produtor/consumidor.

O tempo total médio em milissegundos que os consumidores gastam obtendo dados do agente.

FetchFollowerLocalTimeMsMean

Depois de haver um produtor/consumidor.

O tempo médio em milissegundos que a solicitação do seguidor é processada no líder.

FetchFollowerRequestQueueTimeMsMean

Depois de haver um produtor/consumidor.

O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de solicitações.

FetchFollowerResponseQueueTimeMsMean

Depois de haver um produtor/consumidor.

O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de resposta.

FetchFollowerResponseSendTimeMsMean

Depois de haver um produtor/consumidor.

O tempo médio em milissegundos para o seguidor enviar uma resposta.

FetchFollowerTotalTimeMsMean

Depois de haver um produtor/consumidor.

O tempo total médio em milissegundos que os seguidores gastam obtendo e dados do agente.

FetchThrottleByteRate

Após o controle de utilização da largura de banda ser aplicado.

O número de bytes limitados por segundo.

FetchThrottleQueueSize

Após o controle de utilização da largura de banda ser aplicado.

O número de mensagens na fila do controle de utilização.

FetchThrottleTime

Após o controle de utilização da largura de banda ser aplicado.

O tempo médio de controle de utilização de busca em milissegundos.

IAMNumberOfConnectionRequests

Depois que o cluster passa para o estado ACTIVE.

O número de solicitações de autenticação do IAM por segundo.

IAMTooManyConnections

Depois que o cluster passa para o estado ACTIVE.

O número de tentativas de conexões está acima de 100. 0 significa que o número de conexões está dentro do limite. Se >0, o limite do controle de utilização está sendo excedido e você precisa reduzir o número de conexões.

NetworkProcessorAvgIdlePercent

Depois que o cluster passa para o estado ACTIVE.

A porcentagem média do tempo em que os processadores de rede estão ociosos.

ProduceLocalTimeMsMean

Depois que o cluster passa para o estado ACTIVE.

O tempo médio em milissegundos que a solicitação leva para ser processada no líder.

ProduceRequestQueueTimeMsMean

Depois que o cluster passa para o estado ACTIVE.

O tempo médio em milissegundos que as mensagens de solicitação gastam na fila.

ProduceResponseQueueTimeMsMean

Depois que o cluster passa para o estado ACTIVE.

O tempo médio em milissegundos que as mensagens de resposta gastam na fila.

ProduceResponseSendTimeMsMean

Depois que o cluster passa para o estado ACTIVE.

O tempo médio em milissegundos gasto no envio de mensagens de resposta.

ProduceThrottleByteRate

Após o controle de utilização da largura de banda ser aplicado.

O número de bytes limitados por segundo.

ProduceThrottleQueueSize

Após o controle de utilização da largura de banda ser aplicado.

O número de mensagens na fila do controle de utilização.

ProduceThrottleTime

Após o controle de utilização da largura de banda ser aplicado.

O tempo médio do controle de utilização da produção em milissegundos.

ProduceTotalTimeMsMean

Depois que o cluster passa para o estado ACTIVE.

O tempo médio de produção em milissegundos.

ReplicationBytesInPerSec

Depois de criar um tópico.

O número de bytes por segundo recebidos dos outros agentes.

ReplicationBytesOutPerSec

Depois de criar um tópico.

O número de bytes por segundo enviados para outros agentes.

RequestExemptFromThrottleTime

Após o controle de utilização da solicitação ser aplicado.

O tempo médio gasto em milissegundos em threads de rede e de E/S do agente para processar solicitações isentas de controle de utilização.

RequestHandlerAvgIdlePercent

Depois que o cluster passa para o estado ACTIVE.

A porcentagem média do tempo em que os threads do manipulador de solicitações estão ociosos.

RequestThrottleQueueSize

Após o controle de utilização da solicitação ser aplicado.

O número de mensagens na fila do controle de utilização.

RequestThrottleTime

Após o controle de utilização da solicitação ser aplicado.

O tempo médio do controle de utilização de solicitações em milissegundos.

TcpConnections

Depois que o cluster passa para o estado ACTIVE.

Mostra o número de segmentos TCP de entrada e saída com o sinalizador SYN definido.

TrafficBytes

Depois que o cluster passa para o estado ACTIVE.

Mostra o tráfego de rede em bytes gerais entre clientes (produtores e consumidores) e agentes. O tráfego entre agentes não é relatado.

Monitoramento de nível PER_TOPIC_PER_PARTITION para agentes Express

Ao definir o nível de monitoramento como PER_TOPIC_PER_PARTITION, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis PER_TOPIC_PER_BROKER, PER_BROKER e DEFAULT. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: grupo de consumidores, tópico, partição.

Nome Quando visível Descrição

EstimatedTimeLag

Depois que o grupo de consumidores consome de um tópico.

Estimativa de tempo (em segundos) para drenar o atraso no deslocamento da partição.

OffsetLag

Depois que o grupo de consumidores consome de um tópico.

Atraso do consumidor no nível de partição em número de deslocamentos.

Monitoramento de nível PER_TOPIC_PER_BROKER para agentes Express

Ao definir o nível de monitoramento como PER_TOPIC_PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis PER_BROKER e DEFAULT. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente, tópico.

Importante

As métricas na tabela a seguir aparecem somente depois que os valores ficarem diferentes de zero pela primeira vez. Por exemplo, para ver BytesInPerSec, um ou mais produtores devem primeiro enviar dados para o cluster.

Nome Quando visível Descrição

MessagesInPerSec

Depois de criar um tópico.

O número de mensagens recebidas por segundo.