Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden Sie CloudWatch Metriken, um die Ressourcen von Amazon Managed Service for Prometheus zu überwachen
Amazon Managed Service for Prometheus verkauft Nutzungsmetriken an. CloudWatch Diese Metriken geben Aufschluss über Ihre Workspace-Nutzung. Die verkauften Metriken finden Sie in den Namespaces und in. AWS/Usage
AWS/Prometheus
CloudWatch Diese Metriken sind kostenlos erhältlich. CloudWatch Weitere Informationen zu Nutzungsmetriken finden Sie unter CloudWatch -Nutzungsmetriken.
CloudWatch Name der Metrik | Ressourcenname | CloudWatch Namespace | Beschreibung |
---|---|---|---|
ResourceCount* |
CreateAlertManagerAlertsTPS |
|
Die maximale Anzahl von |
ResourceCount* |
DeleteAlertManagerSilencesTPS |
|
Die maximale Anzahl von |
ResourceCount* |
GetAlertManagerSilenceTPS |
|
Die maximale Anzahl von |
ResourceCount* |
GetAlertManagerStatusTPS |
|
Die maximale Anzahl von |
ResourceCount* |
GetLabelsTPS |
|
Die maximale Anzahl von |
ResourceCount* |
GetMetricMetadataTPS |
|
Die maximale Anzahl von |
ResourceCount* |
GetSeriesTPS |
|
Die maximale Anzahl von |
ResourceCount |
InhibitionRulesInAlertManagerDefinition |
|
Die maximale Anzahl von Unterdrückungsregeln in der Alert-Manager-Definitionsdatei. |
ResourceCount* |
ListAlertManagerAlertGroupInfosTPS |
|
Die maximale Anzahl von |
ResourceCount* |
ListAlertManagerAlertGroupsTPS |
|
Die maximale Anzahl von |
ResourceCount* |
ListAlertManagerAlertsTPS |
|
Die maximale Anzahl von |
ResourceCount* |
ListAlertManagerReceiversTPS |
|
Die maximale Anzahl von |
ResourceCount* |
ListAlertManagerSilencesTPS |
|
Die maximale Anzahl von |
ResourceCount* |
ListAlertsTPS |
|
Die maximale Anzahl von |
ResourceCount* |
ListRulesTPS |
|
Die maximale Anzahl von |
ResourceCount* |
PutAlertManagerSilencesTPS |
|
Die maximale Anzahl von |
ResourceCount |
HAReplicaGroupCount |
|
Anzahl der Replikatgruppen mit hoher Verfügbarkeit |
ResourceCount* |
QueryMetricsTPS |
|
Abfragevorgänge pro Sekunde |
ResourceCount* |
RemoteWriteTPS |
|
Fernschreibvorgänge pro Sekunde |
ResourceCount |
ActiveAlerts |
|
Anzahl der aktiven Alarme pro Workspace Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ResourceCount |
ActiveSeries |
|
Anzahl der aktiven Serien pro Workspace Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ResourceCount |
AlertAggregationGroupSize |
|
Die maximale Größe einer Alarmaggregationsgruppe in der Alert-Manager-Definitionsdatei. Jede Kombination von Labelwerten |
ResourceCount |
AlertManagerDefinitionSizeBytes |
|
Die maximale Größe einer Warnungs-Manager-Definitionsdatei in Byte. |
ResourceCount |
AllSilences |
|
Maximale Anzahl von Stillständen, einschließlich abgelaufener, aktiver und ausstehender Stille, pro Arbeitsbereich. |
ResourceCount |
AllAlerts |
|
Anzahl der Alarme in einem beliebigen Zustand pro Workspace. Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ResourceCount |
IngestionRate |
|
Beispielerfassungsrate Einheiten: Anzahl pro Sekunde Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ResourceCount |
RuleEvaluationInterval |
|
Das Mindestintervall für die Regelauswertung |
ResourceCount |
RuleGroupNamespaceDefinitionSizeBytes |
|
Die maximale Größe einer Regelgruppen-Namespace-Definitionsdatei in Byte. |
ResourceCount |
TemplatesInAlertManagerDefinition |
|
Die maximale Anzahl der Vorlagen in der Alert-Manager-Definitionsdatei. |
ResourceCount |
WorkspaceCount |
|
Die maximale Anzahl von Workspaces pro Region, pro Konto. |
ResourceCount |
SizeOfAlerts |
|
Gesamtgröße aller Benachrichtigungen im Workspace, in Byte Einheiten: Byte Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ResourceCount |
SuppressedAlerts |
|
Anzahl der Alarme im unterdrückten Status pro Workspace. Ein Alarm kann durch Stummschalten oder Unterdrückung unterbunden werden. Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ResourceCount |
UnprocessedAlerts |
|
Anzahl der Alarme im unbearbeiteten Zustand pro Workspace. Eine Warnung befindet sich im unverarbeiteten Zustand, sobald sie von empfangen wurde AlertManager, wartet aber auf die nächste Auswertung der Aggregationsgruppe. Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ResourceCount |
AllAlerts |
|
Anzahl der Alarme in einem beliebigen Zustand pro Workspace. Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ResourceCount |
AllRules |
|
Anzahl der Regeln in einem beliebigen Status pro Workspace. Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ActiveSeriesPerLabelSet |
- |
|
Die aktuelle aktive Serienverwendung für jeden benutzerdefinierten Labelsatz Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
ActiveSeriesLimitPerLabelSet |
- |
|
Der aktuelle aktive Seriengrenzwert für jeden benutzerdefinierten Labelsatz Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
AlertManagerAlertsReceived |
- |
|
Gesamtzahl der erfolgreichen Alerts, die vom Alert Manager empfangen wurden Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
AlertManagerNotificationsFailed |
- |
|
Anzahl der fehlgeschlagenen Alarme Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
AlertManagerNotificationsThrottled |
- |
|
Anzahl der gedrosselten Alarme Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
DiscardedSamples** |
- |
|
Anzahl der verworfenen Beispiele nach Grund Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
DiscardedSamplesPerLabelSet |
- |
|
Die Anzahl der verworfenen Proben für jeden benutzerdefinierten Labelsatz Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
IngestionRatePerLabelSet |
- |
|
Die Aufnahmerate für jeden benutzerdefinierten Etikettensatz Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
QuerySamplesProcessed |
- |
|
Anzahl der verarbeiteten Abfrageproben Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
RuleEvaluations |
- |
|
Gesamtzahl der Regelauswertungen Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
RuleEvaluationFailures |
- |
|
Anzahl der Fehler bei der Regelauswertung im Intervall Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
RuleGroupIterationsMissed |
- |
|
Anzahl der Regelgruppen-Iterationen, die im Intervall verpasst wurden. Einheiten: Anzahl Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
RuleGroupLastEvaluationDuration |
- |
|
Dauer der letzten Auswertung einer Regelgruppe. Einheiten: Sekunden Gültige Statistiken: Minimum, Maximum, Summe, Durchschnitt |
* TPS-Metriken werden jede Minute generiert und sind ein Durchschnittswert pro Sekunde für diese Minute. Kurze Burst-Perioden werden in den TPS-Metriken nicht erfasst.
** Einige der Gründe, die dazu führen, dass Proben verworfen werden, sind folgende.
Grund |
Bedeutung |
---|---|
greater_than_max_sample_age |
Verwerfen von Proben, die älter als eine Stunde sind. |
new-value-for-timestamp |
Doppelte Proben werden mit demselben Zeitstempel wie die vorherige Probe, aber mit unterschiedlichen Werten gesendet. |
per_labelset_series_limit |
Der Benutzer hat das Limit für die Gesamtzahl der aktiven Serien pro Labelsatz erreicht. |
per_metric_series_limit |
Der Benutzer hat das Limit für aktive Serien pro Metrik erreicht. |
per_user_series_limit |
Der Benutzer hat das Limit für die Gesamtzahl der aktiven Serien erreicht. |
rate_limited |
Die Aufnahmerate ist begrenzt. |
sample-out-of-order |
Die Proben werden nicht in der richtigen Reihenfolge versandt und können nicht bearbeitet werden. |
label_value_too_long |
Der Labelwert ist länger als die zulässige Zeichenbeschränkung. |
max_label_names_per_series |
Der Benutzer hat die Labelnamen pro Metrik eingegeben. |
missing_metric_name |
Der Metrikname wurde nicht angegeben. |
metric_name_invalid |
Ungültiger Metrikname angegeben. |
label_invalid |
Ungültiges Etikett angegeben. |
duplicate_label_names |
Doppelte Labelnamen angegeben. |
Anmerkung
Eine Metrik, die nicht existiert oder fehlt, entspricht dem Wert dieser Metrik, der 0 ist.
Anmerkung
RuleGroupIterationsMissed
, RuleEvaluations
RuleEvaluationFailures
, und RuleGroupLastEvaluationDuration
haben die RuleGroup
Dimension der folgenden Struktur:
RuleGroupNamespace
;RuleGroup
CloudWatch Alarm schlagen bei den von Prometheus verkauften Metriken
Sie können die Nutzung der Prometheus-Ressourcen mithilfe CloudWatch von Alarmen überwachen.
Um einen Alarm für die Nummer von ActiveSeriesin Prometheus einzustellen
-
Wählen Sie den Tab Graphed Metrics und scrollen Sie nach unten zum Label. ActiveSeries
In der Ansicht Graphische Metriken werden nur die Metriken angezeigt, die gerade erfasst werden.
-
Wählen Sie das Benachrichtigungssymbol in der Spalte Aktionen aus.
-
Geben Sie unter Metrik und Bedingungen angeben die Schwellenwertbedingung in das Feld Bedingungswert ein und klicken Sie auf Weiter.
-
Wählen Sie unter Aktionen konfigurieren ein vorhandenes SNS-Thema aus oder erstellen Sie ein neues SNS-Thema, an das die Benachrichtigung gesendet werden soll.
-
In Namen und Beschreibung hinzufügen den Namen des Alarms und eine optionale Beschreibung hinzufügen.
-
Wählen Sie Alarm erstellen aus.