Métricas do Amazon MSK para monitorar agentes Express com o CloudWatch
O Amazon MSK tem integração com o CloudWatch para que você possa coletar, visualizar e analisar métricas do CloudWatch dos seus agentes Express do MSK. As métricas que você configurou para o cluster do MSK Provisioned são coletadas e enviadas automaticamente para o CloudWatch em intervalos de um minuto. Você pode definir o nível de monitoramento de um cluster do MSK Provisioned como um dos seguintes: DEFAULT, PER_BROKER, PER_TOPIC_PER_BROKER ou PER_TOPIC_PER_PARTITION. As tabelas nas seções a seguir mostram as métricas disponíveis em cada nível de monitoramento.
As métricas no nível DEFAULT são gratuitas. Os preços de outras métricas estão descritos na página Preços do Amazon CloudWatch
Monitoramento de nível DEFAULT para agentes Express
As métricas descritas na tabela a seguir estão disponíveis gratuitamente no nível de monitoramento DEFAULT.
| Nome | Quando visível | Dimensões | Descrição |
|---|---|---|---|
ActiveControllerCount |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster |
Somente um controlador por cluster deve estar ativo em qualquer momento. |
BytesInPerSec |
Depois de criar um tópico. |
Nome do cluster, ID do agente, tópico |
O número de bytes por segundo recebidos dos clientes. Essa métrica está disponível por agente e também por tópico. |
BytesOutPerSec |
Depois de criar um tópico. |
Nome do cluster, ID do agente, tópico |
O número de bytes por segundo enviados aos clientes. Essa métrica está disponível por agente e também por tópico. |
ClientConnectionCount |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente, autenticação de cliente |
O número de conexões de cliente autenticadas e ativas. |
ConnectionCount |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número de conexões ativas autenticadas, não autenticadas e entre agentes. |
CpuIdle |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
A porcentagem de tempo ocioso da CPU. |
CpuSystem |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
A porcentagem de CPU no espaço do kernel. |
CpuUser |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
A porcentagem de CPU no espaço do usuário. |
GlobalPartitionCount |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster |
O número de partições em todos os tópicos no cluster, excluindo réplicas. Como |
GlobalTopicCount |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster |
Número total de tópicos em todos os agentes no cluster. |
EstimatedMaxTimeLag |
Depois que o grupo de consumidores consome de um tópico. |
Grupo de consumidores, tópico |
Estimativa de tempo (em segundos) para drenar |
LeaderCount |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número total de líderes de partições por agente, sem incluir réplicas. |
MaxOffsetLag |
Depois que o grupo de consumidores consome de um tópico. |
Grupo de consumidores, tópico |
O atraso máximo de deslocamento entre todas as partições em um tópico. |
MemoryBuffered |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O tamanho, em bytes, da memória armazenada em buffer para o agente. |
MemoryCached |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O tamanho, em bytes, da memória armazenada em cache para o agente. |
MemoryFree |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O tamanho, em bytes, de memória que é gratuita e disponível para o agente. |
MemoryUsed |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O tamanho, em bytes, de memória que está em uso pelo agente. |
MessagesInPerSec |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número de mensagens recebidas por segundo do agente. |
NetworkRxDropped |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número de pacotes de recebimento descartados. |
NetworkRxErrors |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número de erros de recepção da rede para o agente. |
NetworkRxPackets |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número de pacotes recebidos pelo agente. |
NetworkTxDropped |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número de pacotes de transmissão descartados. |
NetworkTxErrors |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número de erros de transmissão da rede para o agente. |
NetworkTxPackets |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número de pacotes transmitidos pelo agente. |
PartitionCount |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número total de partições de tópico por agente, incluindo réplicas. |
ProduceTotalTimeMsMean |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O tempo médio de produção em milissegundos. |
RequestBytesMean |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
O número médio de bytes de solicitações do agente. |
RequestTime |
Após o controle de utilização da solicitação ser aplicado. |
Nome do cluster, ID do agente |
O tempo médio gasto em milissegundos em threads de rede e de E/S do agente para processar solicitações. |
| StorageUsed | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster | O total de partições em todos os tópicos no cluster, excluindo réplicas. |
SumOffsetLag |
Depois que o grupo de consumidores consome de um tópico. |
Grupo de consumidores, tópico |
O atraso de deslocamento agregado para todas as partições em um tópico. |
UserPartitionExists |
Depois que o cluster passa para o estado ACTIVE. |
Nome do cluster, ID do agente |
Métrica booleana que indica a presença de uma partição de propriedade do usuário em um agente. O valor 1 indica a presença de partições no agente. |
Monitoramento de nível PER_BROKER para agentes Express
Ao definir o nível de monitoramento como PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas de nível DEFAULT. Você paga pelas métricas de acordo com a tabela a seguir, enquanto as métricas de nível DEFAULT continuam gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente.
| Nome | Quando visível | Descrição |
|---|---|---|
ConnectionCloseRate |
Depois que o cluster passa para o estado ACTIVE. |
O número de conexões fechadas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente. |
ConnectionCreationRate |
Depois que o cluster passa para o estado ACTIVE. |
O número de novas conexões estabelecidas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente. |
FetchConsumerLocalTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo médio em milissegundos que a solicitação do consumidor é processada no líder. |
FetchConsumerRequestQueueTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de solicitações. |
FetchConsumerResponseQueueTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de resposta. |
FetchConsumerResponseSendTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo médio, em milissegundos, para que o consumidor envie uma resposta. |
FetchConsumerTotalTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo total médio em milissegundos que os consumidores gastam obtendo dados do agente. |
FetchFollowerLocalTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo médio em milissegundos que a solicitação do seguidor é processada no líder. |
FetchFollowerRequestQueueTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de solicitações. |
FetchFollowerResponseQueueTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de resposta. |
FetchFollowerResponseSendTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo médio em milissegundos para o seguidor enviar uma resposta. |
FetchFollowerTotalTimeMsMean |
Depois de haver um produtor/consumidor. |
O tempo total médio em milissegundos que os seguidores gastam obtendo e dados do agente. |
FetchThrottleByteRate |
Após o controle de utilização da largura de banda ser aplicado. |
O número de bytes limitados por segundo. |
FetchThrottleQueueSize |
Após o controle de utilização da largura de banda ser aplicado. |
O número de mensagens na fila do controle de utilização. |
FetchThrottleTime |
Após o controle de utilização da largura de banda ser aplicado. |
O tempo médio de controle de utilização de busca em milissegundos. |
IAMNumberOfConnectionRequests |
Depois que o cluster passa para o estado ACTIVE. |
O número de solicitações de autenticação do IAM por segundo. |
IAMTooManyConnections |
Depois que o cluster passa para o estado ACTIVE. |
O número de tentativas de conexões está acima de 100. |
NetworkProcessorAvgIdlePercent |
Depois que o cluster passa para o estado ACTIVE. |
A porcentagem média do tempo em que os processadores de rede estão ociosos. |
ProduceLocalTimeMsMean |
Depois que o cluster passa para o estado ACTIVE. |
O tempo médio em milissegundos que a solicitação leva para ser processada no líder. |
ProduceRequestQueueTimeMsMean |
Depois que o cluster passa para o estado ACTIVE. |
O tempo médio em milissegundos que as mensagens de solicitação gastam na fila. |
ProduceResponseQueueTimeMsMean |
Depois que o cluster passa para o estado ACTIVE. |
O tempo médio em milissegundos que as mensagens de resposta gastam na fila. |
ProduceResponseSendTimeMsMean |
Depois que o cluster passa para o estado ACTIVE. |
O tempo médio em milissegundos gasto no envio de mensagens de resposta. |
ProduceThrottleByteRate |
Após o controle de utilização da largura de banda ser aplicado. |
O número de bytes limitados por segundo. |
ProduceThrottleQueueSize |
Após o controle de utilização da largura de banda ser aplicado. |
O número de mensagens na fila do controle de utilização. |
ProduceThrottleTime |
Após o controle de utilização da largura de banda ser aplicado. |
O tempo médio do controle de utilização da produção em milissegundos. |
ProduceTotalTimeMsMean |
Depois que o cluster passa para o estado ACTIVE. |
O tempo médio de produção em milissegundos. |
ReplicationBytesInPerSec |
Depois de criar um tópico. |
O número de bytes por segundo recebidos dos outros agentes. |
ReplicationBytesOutPerSec |
Depois de criar um tópico. |
O número de bytes por segundo enviados para outros agentes. |
RequestExemptFromThrottleTime |
Após o controle de utilização da solicitação ser aplicado. |
O tempo médio gasto em milissegundos em threads de rede e de E/S do agente para processar solicitações isentas de controle de utilização. |
RequestHandlerAvgIdlePercent |
Depois que o cluster passa para o estado ACTIVE. |
A porcentagem média do tempo em que os threads do manipulador de solicitações estão ociosos. |
RequestThrottleQueueSize |
Após o controle de utilização da solicitação ser aplicado. |
O número de mensagens na fila do controle de utilização. |
RequestThrottleTime |
Após o controle de utilização da solicitação ser aplicado. |
O tempo médio do controle de utilização de solicitações em milissegundos. |
TcpConnections |
Depois que o cluster passa para o estado ACTIVE. |
Mostra o número de segmentos TCP de entrada e saída com o sinalizador SYN definido. |
TrafficBytes |
Depois que o cluster passa para o estado ACTIVE. |
Mostra o tráfego de rede em bytes gerais entre clientes (produtores e consumidores) e agentes. O tráfego entre agentes não é relatado. |
Monitoramento de nível PER_TOPIC_PER_PARTITION para agentes Express
Ao definir o nível de monitoramento como PER_TOPIC_PER_PARTITION, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis PER_TOPIC_PER_BROKER, PER_BROKER e DEFAULT. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: grupo de consumidores, tópico, partição.
| Nome | Quando visível | Descrição |
|---|---|---|
EstimatedTimeLag |
Depois que o grupo de consumidores consome de um tópico. |
Estimativa de tempo (em segundos) para drenar o atraso no deslocamento da partição. |
OffsetLag |
Depois que o grupo de consumidores consome de um tópico. |
Atraso do consumidor no nível de partição em número de deslocamentos. |
Monitoramento de nível PER_TOPIC_PER_BROKER para agentes Express
Ao definir o nível de monitoramento como PER_TOPIC_PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis PER_BROKER e DEFAULT. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente, tópico.
Importante
As métricas na tabela a seguir aparecem somente depois que os valores ficarem diferentes de zero pela primeira vez. Por exemplo, para ver BytesInPerSec, um ou mais produtores devem primeiro enviar dados para o cluster.
| Nome | Quando visível | Descrição |
|---|---|---|
MessagesInPerSec |
Depois de criar um tópico. |
O número de mensagens recebidas por segundo. |