As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus
O Amazon Managed Service para Prometheus vende métricas de uso para. CloudWatch Essas métricas fornecem visibilidade sobre a utilização do seu espaço de trabalho. As métricas vendidas podem ser encontradas nos AWS/Prometheus namespaces AWS/Usage e em. CloudWatch Essas métricas estão disponíveis CloudWatch gratuitamente. Para obter mais informações sobre métricas de uso, consulte Métricas de uso da CloudWatch .
| CloudWatch nome da métrica | Nome do recurso | CloudWatch namespace | Description |
|---|---|---|---|
|
ResourceCount* |
CreateAlertManagerAlertsTPS |
|
O número máximo de operações de |
|
ResourceCount* |
DeleteAlertManagerSilencesTPS |
|
O número máximo de operações de |
|
ResourceCount* |
GetAlertManagerSilenceTPS |
|
O número máximo de operações de |
|
ResourceCount* |
GetAlertManagerStatusTPS |
|
O número máximo de operações de |
|
ResourceCount* |
GetLabelsTPS |
|
O número máximo de operações de |
|
ResourceCount* |
GetMetricMetadataTPS |
|
O número máximo de operações de |
|
ResourceCount* |
GetSeriesTPS |
|
O número máximo de operações de |
|
ResourceCount |
InhibitionRulesInAlertManagerDefinition |
|
Número máximo de regras de inibição no arquivo de definição do gerenciador de alertas. |
|
ResourceCount* |
ListAlertManagerAlertGroupInfosTPS |
|
O número máximo de operações de |
|
ResourceCount* |
ListAlertManagerAlertGroupsTPS |
|
O número máximo de operações de |
|
ResourceCount* |
ListAlertManagerAlertsTPS |
|
O número máximo de operações de |
|
ResourceCount* |
ListAlertManagerReceiversTPS |
|
O número máximo de operações de |
|
ResourceCount* |
ListAlertManagerSilencesTPS |
|
O número máximo de operações de |
|
ResourceCount* |
ListAlertsTPS |
|
O número máximo de operações de |
|
ResourceCount* |
ListRulesTPS |
|
O número máximo de operações de |
|
ResourceCount* |
PutAlertManagerSilencesTPS |
|
O número máximo de operações de |
|
ResourceCount |
HAReplicaGroupCount |
|
Número de grupos de réplicas de alta disponibilidade |
|
ResourceCount* |
QueryMetricsTPS |
|
Operações de consulta por segundo |
|
ResourceCount* |
RemoteWriteTPS |
|
Operações de gravação remota por segundo |
|
ResourceCount |
ActiveAlerts |
|
Número de alertas ativos por espaço de trabalho Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
ResourceCount |
ActiveSeries |
|
Número de séries ativas por espaço de trabalho Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
ResourceCount |
AlertAggregationGroupSize |
|
Tamanho máximo do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas. Cada combinação de valores de rótulo |
|
ResourceCount |
AlertManagerDefinitionSizeBytes |
|
O tamanho máximo de um arquivo de definição do gerenciador de alertas, em bytes. |
|
ResourceCount |
AllSilences |
|
Número máximo de silêncios, incluindo silêncios expirados, ativos e pendentes, por espaço de trabalho. |
|
ResourceCount |
AllAlerts |
|
Número de alertas em qualquer estado por espaço de trabalho. Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
ResourceCount |
IngestionRate |
|
Taxa de ingestão da amostra Unidades: Contagem por segundo Estatísticas válidas: média, mínimo, máximo, soma |
|
ResourceCount |
RuleEvaluationInterval |
|
O intervalo mínimo de avaliação da regra |
|
ResourceCount |
RuleGroupNamespaceDefinitionSizeBytes |
|
O tamanho máximo de um arquivo de definição de namespace de grupo de regras, em bytes. |
|
ResourceCount |
TemplatesInAlertManagerDefinition |
|
O número máximo de modelos no arquivo de definição do gerenciador de alertas. |
|
ResourceCount |
WorkspaceCount |
|
O número máximo de espaços de trabalho por região, por conta. |
|
ResourceCount |
SizeOfAlerts |
|
Tamanho total de todos os alertas no espaço de trabalho, em bytes Unidades: bytes Estatísticas válidas: média, mínimo, máximo, soma |
|
ResourceCount |
SuppressedAlerts |
|
Número de alertas em estado suprimido por espaço de trabalho. Um alerta pode ser suprimido por um silêncio ou uma inibição. Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
ResourceCount |
UnprocessedAlerts |
|
Número de alertas em estado não processado por espaço de trabalho. Um alerta fica em estado não processado depois de recebido AlertManager, mas aguarda a próxima avaliação do grupo de agregação. Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
ResourceCount |
AllAlerts |
|
Número de alertas em qualquer estado por espaço de trabalho. Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
ResourceCount |
AllRules |
|
Número de regras em qualquer estado por espaço de trabalho. Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
ActiveSeriesPerLabelSet |
- |
|
O uso atual da série ativa para cada conjunto de rótulos definido pelo usuário Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
ActiveSeriesLimitPerLabelSet |
- |
|
O valor limite atual da série ativa para cada conjunto de rótulos definido pelo usuário Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
AlertManagerAlertsReceived |
- |
|
Total de alertas concluídos recebidos pelo gerenciador de alertas Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
AlertManagerNotificationsFailed |
- |
|
Número de entregas de alertas com falha Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
AlertManagerNotificationsThrottled |
- |
|
Número de alertas com controle de utilização Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
AnomalyDetectors |
WorkspaceId |
|
Número total de detectores de anomalias para um determinado espaço de trabalho Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
AnomalyDetectorEvaluations |
WorkspaceId, AnomalyDetectorId |
|
Número total de avaliações de detectores de anomalias Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
AnomalyDetectorEvaluationFailures |
WorkspaceId, AnomalyDetectorId |
|
Número de falhas do detector de anomalias no intervalo Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
AnomalyDetectorLastEvaluationDuration |
WorkspaceId, AnomalyDetectorId |
|
Duração da última avaliação de um detector de anomalias Unidades: segundos Estatísticas válidas: média, mínimo, máximo, soma |
|
AnomalyDetectorMissedEvaluations |
WorkspaceId, AnomalyDetectorId |
|
Número de avaliações perdidas de detectores de anomalias no intervalo Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
DiscardedSamples** |
- |
|
Número de amostras descartadas por motivo Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
DiscardedSamplesPerLabelSet |
- |
|
A contagem de amostras descartadas para cada conjunto de etiquetas definido pelo usuário Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
IngestionRatePerLabelSet |
- |
|
A taxa de ingestão para cada conjunto de rótulos definido pelo usuário Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
QuerySamplesProcessed |
- |
|
Número de amostras de consulta processadas Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
RuleEvaluations |
- |
|
Número total de avaliações de regras Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
RuleEvaluationFailures |
- |
|
Número de falhas na avaliação de regras no intervalo Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
RuleGroupIterationsMissed |
- |
|
Número de iterações de grupos de regras perdidas no intervalo. Unidades: contagem Estatísticas válidas: média, mínimo, máximo, soma |
|
RuleGroupLastEvaluationDuration |
- |
|
Duração da última avaliação de um grupo de regras. Unidades: segundos Estatísticas válidas: média, mínimo, máximo, soma |
* As métricas do TPS são geradas a cada minuto e são uma média por segundo durante esse minuto. Períodos curtos de intermitência não serão capturados nas métricas do TPS.
** Alguns dos motivos que fazem com que as amostras sejam descartadas são os seguintes.
|
Motivo |
Significado |
|---|---|
|
greater_than_max_sample_age |
Descarte de amostras com mais de uma hora. |
|
new-value-for-timestamp |
As amostras duplicadas são enviadas com o mesmo registro de data e hora da amostra anterior, mas com valores diferentes. |
|
por limite de série do conjunto de etiquetas |
O usuário atingiu o número total de séries ativas por limite definido por etiqueta. |
|
per_metric_series_limit |
O usuário atingiu o limite ativo da série por métrica. |
|
per_user_series_limit |
O usuário atingiu o limite total de séries ativas. |
|
rate_limited |
Taxa de ingestão limitada. |
|
sample-out-of-order |
As amostras são enviadas fora de ordem e não podem ser processadas. |
|
label_value_too_long |
O valor do rótulo é maior do que o limite permitido de caracteres. |
|
max_label_names_per_series |
O usuário atingiu o limite de nomes dos rótulos por métrica. |
|
missing_metric_name |
O nome da métrica não foi fornecido. |
|
metric_name_invalid |
Nome da métrica inválido fornecido. |
|
label_invalid |
Rótulo inválido fornecido. |
|
duplicate_label_names |
Nomes de rótulos duplicados fornecidos. |
nota
Uma métrica inexistente ou ausente é o mesmo que o valor dessa métrica ser 0.
nota
RuleGroupIterationsMissed,RuleEvaluations,RuleEvaluationFailures, e RuleGroupLastEvaluationDuration têm a RuleGroup dimensão da seguinte estrutura:
RuleGroupNamespace;RuleGroup
Definindo um CloudWatch alarme nas métricas vendidas do Prometheus
Você pode monitorar o uso dos recursos do Prometheus usando alarmes. CloudWatch
Para definir um alarme para o número de ActiveSeriesem Prometheus
-
Escolha a guia Métricas representadas graficamente e role para baixo até o ActiveSeriesrótulo.
Na visualização de Métricas gráficas, somente as métricas que estão sendo ingeridas no momento aparecerão.
-
Escolha o ícone de notificação na coluna Ações.
-
Em Especificar métrica e condições, insira a condição limite no campo Valor das condições e escolha Avançar.
-
Em Configurar ações, selecione um tópico existente do SNS ou crie um novo tópico do SNS para o qual enviar a notificação.
-
Em Adicionar nome e descrição, adicione o nome do alarme e uma descrição opcional.
-
Selecione Criar alarme.