Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus - Amazon Managed Service para Prometheus

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus

O Amazon Managed Service para Prometheus vende métricas de uso para. CloudWatch Essas métricas fornecem visibilidade sobre a utilização do seu espaço de trabalho. As métricas vendidas podem ser encontradas nos AWS/Prometheus namespaces AWS/Usage e em. CloudWatch Essas métricas estão disponíveis CloudWatch gratuitamente. Para obter mais informações sobre métricas de uso, consulte Métricas de uso da CloudWatch .

CloudWatch nome da métrica Nome do recurso CloudWatch namespace Descrição

ResourceCount*

RemoteWriteTPS

AWS/Usage

Operações de gravação remota por segundo

ResourceCount*

QueryMetricsTPS

AWS/Usage

Operações de consulta por segundo

ResourceCount

IngestionRate

AWS/Usage

Taxa de ingestão da amostra

Unidades: contagem por segundo

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

ActiveSeries

AWS/Usage

Número de séries ativas por espaço de trabalho

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

ActiveAlerts

AWS/Usage

Número de alertas ativos por espaço de trabalho

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

SizeOfAlerts

AWS/Usage

Tamanho total de todos os alertas no espaço de trabalho, em bytes

Unidades: bytes

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

SuppressedAlerts

AWS/Usage

Número de alertas em estado suprimido por espaço de trabalho. Um alerta pode ser suprimido por um silêncio ou uma inibição.

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

UnprocessedAlerts

AWS/Usage

Número de alertas em estado não processado por espaço de trabalho. Um alerta fica em estado não processado depois de recebido AlertManager, mas aguarda a próxima avaliação do grupo de agregação.

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ResourceCount

AllAlerts

AWS/Usage

Número de alertas em qualquer estado por espaço de trabalho.

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ActiveSeriesPerLabelSet

-

AWS/Prometheus

O uso atual da série ativa para cada conjunto de rótulos definido pelo usuário

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

ActiveSeriesLimitPerLabelSet

-

AWS/Prometheus

O valor limite atual da série ativa para cada conjunto de rótulos definido pelo usuário

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

AlertManagerAlertsReceived

-

AWS/Prometheus

Total de alertas concluídos recebidos pelo gerenciador de alertas

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

AlertManagerNotificationsFailed

-

AWS/Prometheus

Número de entregas de alertas com falha

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

AlertManagerNotificationsThrottled

-

AWS/Prometheus

Número de alertas com controle de utilização

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

DiscardedSamples**

-

AWS/Prometheus

Número de amostras descartadas por motivo

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

DiscardedSamplesPerLabelSet

-

AWS/Prometheus

A contagem de amostras descartadas para cada conjunto de etiquetas definido pelo usuário

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

IngestionRatePerLabelSet

-

AWS/Prometheus

A taxa de ingestão para cada conjunto de rótulos definido pelo usuário

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

QuerySamplesProcessed

-

AWS/Prometheus

Número de amostras de consulta processadas

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

RuleEvaluations

-

AWS/Prometheus

Número total de avaliações de regras

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

RuleEvaluationFailures

-

AWS/Prometheus

Número de falhas na avaliação de regras no intervalo

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

RuleGroupIterationsMissed

-

AWS/Prometheus

Número de iterações de grupos de regras perdidas no intervalo.

Unidade: contagem

Estatísticas válidas: média, mínimo, máximo, soma

RuleGroupLastEvaluationDuration

-

AWS/Prometheus

Duração da última avaliação de um grupo de regras.

Unidades: segundos

Estatísticas válidas: média, mínimo, máximo, soma

* As métricas do TPS são geradas a cada minuto e são uma média por segundo durante esse minuto. Períodos curtos de intermitência não serão capturados nas métricas do TPS.

** Alguns dos motivos que fazem com que as amostras sejam descartadas são os seguintes.

Motivo

Significado

greater_than_max_sample_age

Descarte de amostras com mais de uma hora.

new-value-for-timestamp

As amostras duplicadas são enviadas com um registro de data e hora diferente do que foi registrado anteriormente.

por limite de série do conjunto de etiquetas

O usuário atingiu o número total de séries ativas por limite definido por etiqueta.

per_metric_series_limit

O usuário atingiu o limite ativo da série por métrica.

per_user_series_limit

O usuário atingiu o limite total de séries ativas.

rate_limited

Taxa de ingestão limitada.

sample-out-of-order

As amostras são enviadas fora de ordem e não podem ser processadas.

label_value_too_long

O valor do rótulo é maior do que o limite permitido de caracteres.

max_label_names_per_series

O usuário atingiu o limite de nomes dos rótulos por métrica.

missing_metric_name

O nome da métrica não foi fornecido.

metric_name_invalid

Nome da métrica inválido fornecido.

label_invalid

Rótulo inválido fornecido.

duplicate_label_names

Nomes de rótulos duplicados fornecidos.

nota

Uma métrica inexistente ou ausente é o mesmo que o valor dessa métrica ser 0.

nota

RuleGroupIterationsMissed,RuleEvaluations,RuleEvaluationFailures, e RuleGroupLastEvaluationDuration têm a RuleGroup dimensão da seguinte estrutura:

RuleGroupNamespace;RuleGroup

Definindo um CloudWatch alarme nas métricas vendidas do Prometheus

Você pode monitorar o uso dos recursos do Prometheus usando alarmes. CloudWatch

Para definir um alarme para o número de ActiveSeriesem Prometheus
  1. Escolha a guia Métricas representadas graficamente e role para baixo até o ActiveSeriesrótulo.

    Na visualização de Métricas gráficas, somente as métricas que estão sendo ingeridas no momento aparecerão.

  2. Escolha o ícone de notificação na coluna Ações.

  3. Em Especificar métrica e condições, insira a condição limite no campo Valor das condições e escolha Avançar.

  4. Em Configurar ações, selecione um tópico existente do SNS ou crie um novo tópico do SNS para o qual enviar a notificação.

  5. Em Adicionar nome e descrição, adicione o nome do alarme e uma descrição opcional.

  6. Selecione Criar alarme.