As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus
O Amazon Managed Service para Prometheus vende métricas de uso para. CloudWatch Essas métricas fornecem visibilidade sobre a utilização do seu espaço de trabalho. As métricas vendidas podem ser encontradas nos AWS/Prometheus
namespaces AWS/Usage
e em. CloudWatch Essas métricas estão disponíveis CloudWatch gratuitamente. Para obter mais informações sobre métricas de uso, consulte Métricas de uso da CloudWatch .
CloudWatch nome da métrica | Nome do recurso | CloudWatch namespace | Descrição |
---|---|---|---|
ResourceCount* |
RemoteWriteTPS |
|
Operações de gravação remota por segundo |
ResourceCount* |
QueryMetricsTPS |
|
Operações de consulta por segundo |
ResourceCount |
IngestionRate |
|
Taxa de ingestão da amostra Unidades: contagem por segundo Estatísticas válidas: média, mínimo, máximo, soma |
ResourceCount |
ActiveSeries |
|
Número de séries ativas por espaço de trabalho Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
ResourceCount |
ActiveAlerts |
|
Número de alertas ativos por espaço de trabalho Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
ResourceCount |
SizeOfAlerts |
|
Tamanho total de todos os alertas no espaço de trabalho, em bytes Unidades: bytes Estatísticas válidas: média, mínimo, máximo, soma |
ResourceCount |
SuppressedAlerts |
|
Número de alertas em estado suprimido por espaço de trabalho. Um alerta pode ser suprimido por um silêncio ou uma inibição. Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
ResourceCount |
UnprocessedAlerts |
|
Número de alertas em estado não processado por espaço de trabalho. Um alerta fica em estado não processado depois de recebido AlertManager, mas aguarda a próxima avaliação do grupo de agregação. Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
ResourceCount |
AllAlerts |
|
Número de alertas em qualquer estado por espaço de trabalho. Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
ActiveSeriesPerLabelSet |
- |
|
O uso atual da série ativa para cada conjunto de rótulos definido pelo usuário Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
ActiveSeriesLimitPerLabelSet |
- |
|
O valor limite atual da série ativa para cada conjunto de rótulos definido pelo usuário Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
AlertManagerAlertsReceived |
- |
|
Total de alertas concluídos recebidos pelo gerenciador de alertas Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
AlertManagerNotificationsFailed |
- |
|
Número de entregas de alertas com falha Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
AlertManagerNotificationsThrottled |
- |
|
Número de alertas com controle de utilização Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
DiscardedSamples** |
- |
|
Número de amostras descartadas por motivo Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
DiscardedSamplesPerLabelSet |
- |
|
A contagem de amostras descartadas para cada conjunto de etiquetas definido pelo usuário Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
IngestionRatePerLabelSet |
- |
|
A taxa de ingestão para cada conjunto de rótulos definido pelo usuário Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
QuerySamplesProcessed |
- |
|
Número de amostras de consulta processadas Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
RuleEvaluations |
- |
|
Número total de avaliações de regras Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
RuleEvaluationFailures |
- |
|
Número de falhas na avaliação de regras no intervalo Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
RuleGroupIterationsMissed |
- |
|
Número de iterações de grupos de regras perdidas no intervalo. Unidade: contagem Estatísticas válidas: média, mínimo, máximo, soma |
RuleGroupLastEvaluationDuration |
- |
|
Duração da última avaliação de um grupo de regras. Unidades: segundos Estatísticas válidas: média, mínimo, máximo, soma |
* As métricas do TPS são geradas a cada minuto e são uma média por segundo durante esse minuto. Períodos curtos de intermitência não serão capturados nas métricas do TPS.
** Alguns dos motivos que fazem com que as amostras sejam descartadas são os seguintes.
Motivo |
Significado |
---|---|
greater_than_max_sample_age |
Descarte de amostras com mais de uma hora. |
new-value-for-timestamp |
As amostras duplicadas são enviadas com um registro de data e hora diferente do que foi registrado anteriormente. |
por limite de série do conjunto de etiquetas |
O usuário atingiu o número total de séries ativas por limite definido por etiqueta. |
per_metric_series_limit |
O usuário atingiu o limite ativo da série por métrica. |
per_user_series_limit |
O usuário atingiu o limite total de séries ativas. |
rate_limited |
Taxa de ingestão limitada. |
sample-out-of-order |
As amostras são enviadas fora de ordem e não podem ser processadas. |
label_value_too_long |
O valor do rótulo é maior do que o limite permitido de caracteres. |
max_label_names_per_series |
O usuário atingiu o limite de nomes dos rótulos por métrica. |
missing_metric_name |
O nome da métrica não foi fornecido. |
metric_name_invalid |
Nome da métrica inválido fornecido. |
label_invalid |
Rótulo inválido fornecido. |
duplicate_label_names |
Nomes de rótulos duplicados fornecidos. |
nota
Uma métrica inexistente ou ausente é o mesmo que o valor dessa métrica ser 0.
nota
RuleGroupIterationsMissed
,RuleEvaluations
,RuleEvaluationFailures
, e RuleGroupLastEvaluationDuration
têm a RuleGroup
dimensão da seguinte estrutura:
RuleGroupNamespace
;RuleGroup
Definindo um CloudWatch alarme nas métricas vendidas do Prometheus
Você pode monitorar o uso dos recursos do Prometheus usando alarmes. CloudWatch
Para definir um alarme para o número de ActiveSeriesem Prometheus
-
Escolha a guia Métricas representadas graficamente e role para baixo até o ActiveSeriesrótulo.
Na visualização de Métricas gráficas, somente as métricas que estão sendo ingeridas no momento aparecerão.
-
Escolha o ícone de notificação na coluna Ações.
-
Em Especificar métrica e condições, insira a condição limite no campo Valor das condições e escolha Avançar.
-
Em Configurar ações, selecione um tópico existente do SNS ou crie um novo tópico do SNS para o qual enviar a notificação.
-
Em Adicionar nome e descrição, adicione o nome do alarme e uma descrição opcional.
-
Selecione Criar alarme.