Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Beheben Sie Fehler im Alert Manager mithilfe von Protokollen CloudWatch
Mit Überwachen Sie Amazon Managed Service für Prometheus-Ereignisse mit Protokollen CloudWatch können Sie Probleme im Zusammenhang mit Alert Manager und Ruler beheben. Dieser Abschnitt enthält Themen zur Fehlerbehebung im Zusammenhang mit Alert Manager.
Themen
Warnung vor aktiven Alarmen
Wenn das Protokoll die folgende Warnung enthält
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "too many alerts, limit: 1000", "level": "WARN" }, "component": "alertmanager" }
Dies bedeutet, dass das Kontingent für aktive Benachrichtigungen des Alert Managers überschritten wurde.
Maßnahme
Anfordern einer Kontingenterhöhung. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Service Quotas Quotas-Konsole unter https://console.aws.amazon.com/servicequotas/
Warnung zur Größe der Alert-Aggregationsgruppe
Wenn das Protokoll die folgende Warnung enthält
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Too many aggregation groups, cannot create new group for alert, groups=1000, limit=1000, alert=sample-alert", "level": "WARN" }, "component": "alertmanager" }
Dies bedeutet, dass das Größenkontingent für die Alert Manager-Alert-Aggregationsgruppe überschritten wurde.
Maßnahme
Reduzieren Sie die Größe der Alert-Aggregationsgruppe mithilfe des group_by
Parameters. Weitere Informationen finden Sie in der Prometheus-Dokumentation unter Route-bezogene Einstellungen
Sie können auch eine Kontingenterhöhung beantragen. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Service Quotas Quotas-Konsole unter https://console.aws.amazon.com/servicequotas/
Die Größe der Warnmeldungen ist zu groß, Warnung
Wenn das Protokoll die folgende Warnung enthält
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "alerts too big, total size limit: 20000000 bytes", "level": "WARN" }, "component": "alertmanager" }
Das bedeutet, dass das Größenkontingent für Alert Manager-Benachrichtigungen pro Arbeitsbereich überschritten wurde.
Maßnahme
Entfernen Sie unnötige Anmerkungen und Beschriftungen, um die Größe der Warnmeldungen zu reduzieren.
Warnung vor leerem Inhalt
Wenn das Protokoll die folgende Warnung enthält
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been modified because the content was empty." "level": "WARN" }, "component": "alertmanager" }
Das bedeutet, dass die Alert-Manager-Vorlage die ausgehende Warnung in eine leere Nachricht aufgelöst hat.
Maßnahme
Validieren Sie Ihre Alert-Manager-Vorlage und stellen Sie sicher, dass Sie über eine gültige Vorlage für alle Empfängerpfade verfügen.
Ungültige key/value
Warnung
Wenn das Protokoll die folgende Warnung enthält
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "MessageAttributes has been removed because of invalid key/value, numberOfRemovedAttributes=1" "level": "WARN" }, "component": "alertmanager" }
Das bedeutet, dass einige Nachrichtenattribute entfernt wurden, weil keys/values sie ungültig sind.
Maßnahme
Prüfen Sie die Vorlagen erneut, die Sie zum Füllen der Nachrichtenattribute verwenden, und stellen Sie sicher, dass sie in ein gültiges SNS-Nachrichtenattribut aufgelöst werden. Weitere Informationen zum Überprüfen einer Nachricht an ein Amazon-SNS-Thema finden Sie unter SNS-Thema validieren
Warnung vor Nachrichtenlimit
Wenn das Protokoll die folgende Warnung enthält
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been truncated because it exceeds size limit, originSize=266K, truncatedSize=12K" "level": "WARN" }, "component": "alertmanager" }
Das bedeutet, dass ein Teil der Nachrichtengröße zu groß ist.
Maßnahme
Sehen Sie sich die Nachrichtenvorlage für den Alert-Empfänger an und überarbeiten Sie sie so, dass sie innerhalb der Größenbeschränkung liegt.
Kein ressourcenbasierter Richtlinienfehler
Wenn das Protokoll den folgenden Fehler enthält
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to perform: SNS:Publish on resource: arn:aws:sns:us-west-2:12345:testSnsReceiver because no resource-based policy allows the SNS:Publish action" "level": "ERROR" }, "component": "alertmanager" }
Das bedeutet, dass Amazon Managed Service für Prometheus nicht über die erforderlichen Rechte verfügt, um die Warnung an das angegebene SNS-Thema zu senden.
Maßnahme
Stellen Sie sicher, dass die Zugriffsrichtlinie für Ihr Amazon-SNS-Thema Amazon Managed Service for Prometheus die Möglichkeit einräumt, SNS-Nachrichten an das Thema zu senden. Erstellen Sie eine SNS-Zugriffsrichtlinie, die dem Service aps.amazonaws.com
(Amazon Managed Service for Prometheus) Zugriff auf Ihr Amazon SNS SNS-Thema gewährt. Weitere Informationen zu SNS-Zugriffsrichtlinien finden Sie unter Using the Access Policy Language und Beispielfälle für die Amazon SNS SNS-Zugriffskontrolle im Amazon Simple Notification Service Developer Guide.
Nicht-ASCII-Warnung
Wenn das Protokoll die folgende Warnung enthält
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Subject has been modified because it contains control or non-ASCII characters." "level": "WARN" }, "component": "alertmanager" }
Das bedeutet, dass der Betreff Nicht-ASCII-Zeichen enthält.
Maßnahme
Entfernen Sie Verweise im Betrefffeld Ihrer Vorlage auf den Beschriftungen, die möglicherweise Nicht-ASCII-Zeichen enthalten.
Nicht berechtigt, KMS anzurufen
Wenn das Protokoll den folgenden AWS KMS Fehler enthält
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to call KMS", "level": "ERROR" }, "component": "alertmanager" }
Maßnahme
Stellen Sie sicher, dass die Schlüsselrichtlinie des Schlüssels, der zur Verschlüsselung des Amazon SNS SNS-Themas verwendet wird, es dem Amazon Managed Service for Prometheus Service Service for Prometheus Service Service Service for Prometheus ermöglichtaps.amazonaws.com
, die folgenden Aktionen durchzuführen:, und. kms:GenerateDataKey*
kms:Decrypt
Weitere Informationen finden Sie unter AWS
KMS-Berechtigungen für SNS-Themen.
Vorlagenfehler
Wenn das Protokoll den folgenden Fehler enthält
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Notify for alerts failed. There is an error in a receiver that is using templates in the AlertManager definition. Make sure that the syntax is correct and only template functions and variables that exist are used in the receiver 'default', sns_configs position #2, section 'attributes'" "level": "ERROR" }, "component": "alertmanager" }
Dies bedeutet, dass ein Fehler in einer Vorlage vorliegt, die in der AlertManager Definition verwendet wird. Der Fehlereintrag enthält Anweisungen zum Empfänger, zur Position in den sns_configs und zu der Eigenschaft, die Fehler enthält.
Maßnahme
Überprüfen Sie Ihre Alert Manager-Definition. Stellen Sie sicher, dass die Syntax korrekt ist und dass Sie auf vorhandene Vorlagenvariablen und Funktionen verweisen. Weitere Informationen finden Sie in der Notification Template Reference