Monitoramento de nível DEFAULT para agentes Express Monitoramento de nível PER_BROKER para agentes Express Monitoramento de nível PER_TOPIC_PER_PARTITION para agentes Express Monitoramento de nível PER_TOPIC_PER_BROKER para agentes Express

Métricas do Amazon MSK para monitorar corretores Express com CloudWatch

O Amazon MSK se integra CloudWatch para que você possa coletar, visualizar e analisar CloudWatch métricas para seus corretores MSK Express. As métricas que você configura para seus clusters provisionados pelo MSK são coletadas e enviadas automaticamente em intervalos de 1 CloudWatch minuto. Você pode definir o nível de monitoramento de um cluster do MSK Provisioned como um dos seguintes: DEFAULT, PER_BROKER, PER_TOPIC_PER_BROKER ou PER_TOPIC_PER_PARTITION. As tabelas nas seções a seguir mostram as métricas disponíveis em cada nível de monitoramento.

As métricas no nível DEFAULT são gratuitas. Os preços de outras métricas estão descritos na página de CloudWatchpreços da Amazon.

Monitoramento de nível `DEFAULT` para agentes Express

As métricas descritas na tabela a seguir estão disponíveis gratuitamente no nível de monitoramento DEFAULT.

Nome	Quando visível	Dimensões	Description
ActiveControllerCount	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster	Somente um controlador por cluster deve estar ativo em qualquer momento.
BytesInPerSec	Depois de criar um tópico.	Nome do cluster, ID do agente, tópico	O número de bytes por segundo recebidos dos clientes. Essa métrica está disponível por agente e também por tópico.
BytesOutPerSec	Depois de criar um tópico.	Nome do cluster, ID do agente, tópico	O número de bytes por segundo enviados aos clientes. Essa métrica está disponível por agente e também por tópico.
ClientConnectionCount	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente, autenticação de cliente	O número de conexões de cliente autenticadas e ativas.
ConnectionCount	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de conexões ativas autenticadas, não autenticadas e entre agentes.
CpuIdle	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem de tempo ocioso da CPU.
CpuSystem	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem de CPU no espaço do kernel.
CpuUser	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem de CPU no espaço do usuário.
GlobalPartitionCount	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster	O número de partições em todos os tópicos no cluster, excluindo réplicas. Como `GlobalPartitionCount` não inclui réplicas, a soma dos valores de `PartitionCount` pode ser maior que `GlobalPartitionCount` se o fator de replicação de um tópico for maior que `1`.
GlobalTopicCount	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster	Número total de tópicos em todos os agentes no cluster.
EstimatedMaxTimeLag	Depois que o grupo de consumidores consome de um tópico.	Grupo de consumidores, tópico	Estimativa de tempo (em segundos) para drenar `MaxOffsetLag`.
LeaderCount	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número total de líderes de partições por agente, sem incluir réplicas.
MaxOffsetLag	Depois que o grupo de consumidores consome de um tópico.	Grupo de consumidores, tópico	O atraso máximo de deslocamento entre todas as partições em um tópico.
MemoryBuffered	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, da memória armazenada em buffer para o agente.
MemoryCached	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, da memória armazenada em cache para o agente.
MemoryFree	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, de memória que é gratuita e disponível para o agente.
MemoryUsed	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, de memória que está em uso pelo agente.
MessagesInPerSec	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de mensagens recebidas por segundo do agente.
NetworkRxDropped	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de pacotes de recebimento descartados.
NetworkRxErrors	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de erros de recepção da rede para o agente.
NetworkRxPackets	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de pacotes recebidos pelo agente.
NetworkTxDropped	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de pacotes de transmissão descartados.
NetworkTxErrors	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de erros de transmissão da rede para o agente.
NetworkTxPackets	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de pacotes transmitidos pelo agente.
PartitionCount	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número total de partições de tópico por agente, incluindo réplicas.
ProduceTotalTimeMsMean	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tempo médio de produção em milissegundos.
RequestBytesMean	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número médio de bytes de solicitações do agente.
RequestTime	Após o controle de utilização da solicitação ser aplicado.	Nome do cluster, ID do agente	O tempo médio em milissegundos gasto na rede do agente e nos I/O threads para processar solicitações.
StorageUsed	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster	O total de partições em todos os tópicos no cluster, excluindo réplicas.
SumOffsetLag	Depois que o grupo de consumidores consome de um tópico.	Grupo de consumidores, tópico	O atraso de deslocamento agregado para todas as partições em um tópico.
UserPartitionExists	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	Métrica booleana que indica a presença de uma partição de propriedade do usuário em um agente. O valor 1 indica a presença de partições no agente.

Monitoramento de nível `PER_BROKER` para agentes Express

Ao definir o nível de monitoramento como PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas de nível DEFAULT. Você paga pelas métricas de acordo com a tabela a seguir, enquanto as métricas de nível DEFAULT continuam gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente.

Nome	Quando visível	Description
ConnectionCloseRate	Depois que o cluster passa para o estado ACTIVE.	O número de conexões fechadas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente.
ConnectionCreationRate	Depois que o cluster passa para o estado ACTIVE.	O número de novas conexões estabelecidas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente.
FetchConsumerLocalTimeMsMean	Depois de haver um produtor/consumidor.	O tempo médio em milissegundos que a solicitação do consumidor é processada no líder.
FetchConsumerRequestQueueTimeMsMean	Depois de haver um produtor/consumidor.	O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de solicitações.
FetchConsumerResponseQueueTimeMsMean	Depois de haver um produtor/consumidor.	O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de resposta.
FetchConsumerResponseSendTimeMsMean	Depois de haver um produtor/consumidor.	O tempo médio, em milissegundos, para que o consumidor envie uma resposta.
FetchConsumerTotalTimeMsMean	Depois de haver um produtor/consumidor.	O tempo total médio em milissegundos que os consumidores gastam obtendo dados do agente.
FetchFollowerLocalTimeMsMean	Depois de haver um produtor/consumidor.	O tempo médio em milissegundos que a solicitação do seguidor é processada no líder.
FetchFollowerRequestQueueTimeMsMean	Depois de haver um produtor/consumidor.	O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de solicitações.
FetchFollowerResponseQueueTimeMsMean	Depois de haver um produtor/consumidor.	O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de resposta.
FetchFollowerResponseSendTimeMsMean	Depois de haver um produtor/consumidor.	O tempo médio em milissegundos para o seguidor enviar uma resposta.
FetchFollowerTotalTimeMsMean	Depois de haver um produtor/consumidor.	O tempo total médio em milissegundos que os seguidores gastam obtendo e dados do agente.
FetchThrottleByteRate	Após o controle de utilização da largura de banda ser aplicado.	O número de bytes limitados por segundo.
FetchThrottleQueueSize	Após o controle de utilização da largura de banda ser aplicado.	O número de mensagens na fila do controle de utilização.
FetchThrottleTime	Após o controle de utilização da largura de banda ser aplicado.	O tempo médio de controle de utilização de busca em milissegundos.
IAMNumberOfConnectionRequests	Depois que o cluster passa para o estado ACTIVE.	O número de solicitações de autenticação do IAM por segundo.
IAMTooManyConnections	Depois que o cluster passa para o estado ACTIVE.	O número de tentativas de conexões está acima de 100. `0` significa que o número de conexões está dentro do limite. Se `>0`, o limite do controle de utilização está sendo excedido e você precisa reduzir o número de conexões.
NetworkProcessorAvgIdlePercent	Depois que o cluster passa para o estado ACTIVE.	A porcentagem média do tempo em que os processadores de rede estão ociosos.
ProduceLocalTimeMsMean	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos que a solicitação leva para ser processada no líder.
ProduceRequestQueueTimeMsMean	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos que as mensagens de solicitação gastam na fila.
ProduceResponseQueueTimeMsMean	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos que as mensagens de resposta gastam na fila.
ProduceResponseSendTimeMsMean	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos gasto no envio de mensagens de resposta.
ProduceThrottleByteRate	Após o controle de utilização da largura de banda ser aplicado.	O número de bytes limitados por segundo.
ProduceThrottleQueueSize	Após o controle de utilização da largura de banda ser aplicado.	O número de mensagens na fila do controle de utilização.
ProduceThrottleTime	Após o controle de utilização da largura de banda ser aplicado.	O tempo médio do controle de utilização da produção em milissegundos.
ProduceTotalTimeMsMean	Depois que o cluster passa para o estado ACTIVE.	O tempo médio de produção em milissegundos.
ReplicationBytesInPerSec	Depois de criar um tópico.	O número de bytes por segundo recebidos dos outros agentes.
ReplicationBytesOutPerSec	Depois de criar um tópico.	O número de bytes por segundo enviados para outros agentes.
RequestExemptFromThrottleTime	Após o controle de utilização da solicitação ser aplicado.	O tempo médio em milissegundos gasto na rede do broker e nos I/O threads para processar solicitações isentas de limitação.
RequestHandlerAvgIdlePercent	Depois que o cluster passa para o estado ACTIVE.	A porcentagem média do tempo em que os threads do manipulador de solicitações estão ociosos.
RequestThrottleQueueSize	Após o controle de utilização da solicitação ser aplicado.	O número de mensagens na fila do controle de utilização.
RequestThrottleTime	Após o controle de utilização da solicitação ser aplicado.	O tempo médio do controle de utilização de solicitações em milissegundos.
TcpConnections	Depois que o cluster passa para o estado ACTIVE.	Mostra o número de segmentos TCP de entrada e saída com o sinalizador SYN definido.
TrafficBytes	Depois que o cluster passa para o estado ACTIVE.	Mostra o tráfego de rede em bytes gerais entre clientes (produtores e consumidores) e agentes. O tráfego entre agentes não é relatado.

Monitoramento de nível `PER_TOPIC_PER_PARTITION` para agentes Express

Ao definir o nível de monitoramento como PER_TOPIC_PER_PARTITION, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis PER_TOPIC_PER_BROKER, PER_BROKER e DEFAULT. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: grupo de consumidores, tópico, partição.

Nome	Quando visível	Description
EstimatedTimeLag	Depois que o grupo de consumidores consome de um tópico.	Estimativa de tempo (em segundos) para drenar o atraso no deslocamento da partição.
OffsetLag	Depois que o grupo de consumidores consome de um tópico.	Atraso do consumidor no nível de partição em número de deslocamentos.

Monitoramento de nível `PER_TOPIC_PER_BROKER` para agentes Express

Ao definir o nível de monitoramento como PER_TOPIC_PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis PER_BROKER e DEFAULT. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente, tópico.

Importante

As métricas na tabela a seguir aparecem somente depois que os valores ficarem diferentes de zero pela primeira vez. Por exemplo, para ver BytesInPerSec, um ou mais produtores devem primeiro enviar dados para o cluster.

Nome	Quando visível	Description
MessagesInPerSec	Depois de criar um tópico.	O número de mensagens recebidas por segundo.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Estados do cluster do MSK Provisioned

Monitore com o Prometheus