Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisez CloudWatch des métriques pour surveiller les ressources Amazon Managed Service for Prometheus
Amazon Managed Service for Prometheus envoie des statistiques d'utilisation à. CloudWatch Ces métriques fournissent une visibilité sur l’utilisation de votre espace de travail. Les métriques vendues se trouvent dans les AWS/Prometheus
espaces de noms AWS/Usage
et dans. CloudWatch Ces statistiques sont disponibles CloudWatch gratuitement. Pour plus d'informations sur les métriques, consultez Métriques d'utilisation d'CloudWatch .
CloudWatch nom de la métrique | Nom de la ressource | CloudWatch espace de noms | Description |
---|---|---|---|
ResourceCount* |
CreateAlertManagerAlertsTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
DeleteAlertManagerSilencesTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
GetAlertManagerSilenceTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
GetAlertManagerStatusTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
GetLabelsTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
GetMetricMetadataTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
GetSeriesTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount |
InhibitionRulesInAlertManagerDefinition |
|
Nombre maximal de règles d’inhibition dans le fichier de définition du gestionnaire d’alertes. |
ResourceCount* |
ListAlertManagerAlertGroupInfosTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
ListAlertManagerAlertGroupsTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
ListAlertManagerAlertsTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
ListAlertManagerReceiversTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
ListAlertManagerSilencesTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
ListAlertsTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
ListRulesTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount* |
PutAlertManagerSilencesTPS |
|
Le nombre maximum d'opérations d' |
ResourceCount |
HAReplicaGroupCount |
|
Nombre de groupes de répliques à haute disponibilité |
ResourceCount* |
QueryMetricsTPS |
|
Opérations de requête par seconde |
ResourceCount* |
RemoteWriteTPS |
|
Opérations d'écriture à distance par seconde |
ResourceCount |
ActiveAlerts |
|
Nombre d’alertes actives par espace de travail Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
ResourceCount |
ActiveSeries |
|
Nombre de séries actives par espace de travail Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
ResourceCount |
AlertAggregationGroupSize |
|
Taille maximale d’un groupe d’agrégation d’alertes dans le fichier de définition du gestionnaire d’alertes. Chaque combinaison de valeurs d'étiquette |
ResourceCount |
AlertManagerDefinitionSizeBytes |
|
Taille maximale d'un fichier de définition du gestionnaire d'alertes, en octets. |
ResourceCount |
AllSilences |
|
Nombre maximum de silences, y compris les silences expirés, actifs et en attente, par espace de travail. |
ResourceCount |
AllAlerts |
|
Nombre d’alertes dans n’importe quel état par espace de travail. Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
ResourceCount |
IngestionRate |
|
Taux d’ingestion d’échantillons Unités : nombre par seconde Statistiques valides : moyenne, minimum, maximum, somme |
ResourceCount |
RuleEvaluationInterval |
|
Intervalle minimal d'évaluation des règles |
ResourceCount |
RuleGroupNamespaceDefinitionSizeBytes |
|
Taille maximale d'un fichier de définition d'espace de noms de groupe de règles, en octets. |
ResourceCount |
TemplatesInAlertManagerDefinition |
|
Nombre maximal de modèles dans le fichier de définition du gestionnaire d’alertes. |
ResourceCount |
WorkspaceCount |
|
Le nombre maximum d'espaces de travail par région, par compte. |
ResourceCount |
SizeOfAlerts |
|
Taille totale de toutes les alertes de l'espace de travail, en octets Unité : Octets Statistiques valides : moyenne, minimum, maximum, somme |
ResourceCount |
SuppressedAlerts |
|
Nombre d’alertes supprimées par espace de travail. Une alerte peut être supprimée par un silence ou une inhibition. Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
ResourceCount |
UnprocessedAlerts |
|
Nombre d’alertes non traitées par espace de travail. Une alerte n'est pas traitée une fois qu'elle est reçue par AlertManager, mais elle attend la prochaine évaluation du groupe d'agrégation. Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
ResourceCount |
AllAlerts |
|
Nombre d’alertes dans n’importe quel état par espace de travail. Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
ResourceCount |
AllRules |
|
Nombre de règles par état par espace de travail. Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
ActiveSeriesPerLabelSet |
- |
|
L'utilisation actuelle de la série active pour chaque jeu d'étiquettes défini par l'utilisateur Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
ActiveSeriesLimitPerLabelSet |
- |
|
La valeur limite de série active actuelle pour chaque jeu d'étiquettes défini par l'utilisateur Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
AlertManagerAlertsReceived |
- |
|
Nombre total d'alertes réussies reçues par le gestionnaire d'alertes Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
AlertManagerNotificationsFailed |
- |
|
Nombre de livraisons d’alertes ayant échoué Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
AlertManagerNotificationsThrottled |
- |
|
Nombre d’alertes bloquées Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
DiscardedSamples** |
- |
|
Nombre d’échantillons rejetés par motif Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
DiscardedSamplesPerLabelSet |
- |
|
Le nombre d'échantillons rejetés pour chaque jeu d'étiquettes défini par l'utilisateur Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
IngestionRatePerLabelSet |
- |
|
Le taux d'ingestion pour chaque jeu d'étiquettes défini par l'utilisateur Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
QuerySamplesProcessed |
- |
|
Nombre d'échantillons de requêtes traités Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
RuleEvaluations |
- |
|
Nombre total d’évaluations de règles Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
RuleEvaluationFailures |
- |
|
Nombre d’échecs d’évaluation des règles dans l’intervalle Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
RuleGroupIterationsMissed |
- |
|
Nombre d’itérations de groupes de règles manquées dans l’intervalle. Unités : nombre Statistiques valides : moyenne, minimum, maximum, somme |
RuleGroupLastEvaluationDuration |
- |
|
Durée de la dernière évaluation d'un groupe de règles. Unités : secondes Statistiques valides : moyenne, minimum, maximum, somme |
* Les métriques TPS sont générées chaque minute et sont une moyenne par seconde sur cette minute. Les courtes périodes de rafale ne seront pas capturées dans les métriques TPS.
** Certaines des raisons pour lesquelles les échantillons sont jetés sont les suivantes.
Raison |
Signification |
---|---|
greater_than_max_sample_age |
Jeter les échantillons datant de plus d'une heure. |
new-value-for-timestamp |
Les échantillons dupliqués sont envoyés avec le même horodatage que l'échantillon précédent, mais avec des valeurs différentes. |
per_labelset_series_limit |
L'utilisateur a atteint le nombre total de séries actives par limite définie d'étiquettes. |
per_metric_series_limit |
L'utilisateur a atteint la limite de séries actives par métrique. |
per_user_series_limit |
L'utilisateur a atteint la limite du nombre total de séries actives. |
rate_limited |
Taux d'ingestion limité. |
sample-out-of-order |
Les échantillons sont envoyés hors commande et ne peuvent pas être traités. |
label_value_too long |
La valeur de l'étiquette est supérieure à la limite de caractères autorisée. |
max_label_names_per_series |
L'utilisateur a sélectionné les noms des libellés par métrique. |
missing_metric_name |
Le nom de la métrique n'est pas fourni. |
metric_name_invalid |
Le nom de métrique fourni n'est pas valide. |
label_invalid |
Libellé fourni non valide. |
duplicate_label_names |
Des noms d'étiquettes dupliqués ont été fournis. |
Note
Une métrique inexistante ou manquante est identique à la valeur de cette métrique égale à 0.
Note
RuleGroupIterationsMissed
, RuleEvaluations
RuleEvaluationFailures
, et RuleGroupLastEvaluationDuration
ont la RuleGroup
dimension de la structure suivante :
RuleGroupNamespace
;RuleGroup
Régler une CloudWatch alarme sur les métriques vendues par Prometheus
Vous pouvez surveiller l'utilisation des ressources Prometheus à l'aide d'alarmes. CloudWatch
Pour régler une alarme sur le nombre de ActiveSeriesdans Prometheus
-
Choisissez l'onglet Graphed metrics et faites défiler l'écran vers le bas jusqu'à l'ActiveSeriesétiquette.
Dans la vue Graphed metrics, seules les métriques actuellement ingérées apparaissent.
-
Sélectionnez l’icône de notification dans la colonne Actions.
-
Dans Specify metric and conditions, entrez la condition de seuil dans le champ Conditions value et choisissez Suivant.
-
Dans Configure actions, sélectionnez une rubrique SNS existante ou créez-en une nouvelle à laquelle envoyer la notification.
-
Dans Add name and description, ajoutez le nom de l’alarme et une description facultative.
-
Sélectionnez Créer une alerte.