Résoudre les problèmes liés au gestionnaire d'alertes avec les journaux CloudWatch - Amazon Managed Service for Prometheus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résoudre les problèmes liés au gestionnaire d'alertes avec les journaux CloudWatch

Surveillez les événements Prometheus via Amazon Managed Service grâce aux journaux CloudWatch vous permet de résoudre les problèmes liés au gestionnaire d’alertes et à l’outil de règle. Cette section contient des rubriques de dépannage relatives au gestionnaire d’alertes.

Alertes actives (avertissement)

Lorsque le journal contient l’avertissement suivant

{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "too many alerts, limit: 1000", "level": "WARN" }, "component": "alertmanager" }

Cela signifie que le quota d'alertes actives du gestionnaire d'alertes est dépassé.

Action à exécuter

Demandez une augmentation de quota. Connectez-vous à la console Service Quotas AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/servicequotas/.

Avertissement concernant la taille du groupe d'agrégation d'alertes

Lorsque le journal contient l’avertissement suivant

{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Too many aggregation groups, cannot create new group for alert, groups=1000, limit=1000, alert=sample-alert", "level": "WARN" }, "component": "alertmanager" }

Cela signifie que le quota de taille du groupe d'agrégation d'alertes du gestionnaire d'alertes a été dépassé.

Action à exécuter

Réduisez la taille du groupe d'agrégation d'alertes en utilisant le group_by paramètre. Pour plus d'informations, consultez la section Paramètres relatifs à l'itinéraire dans la documentation de Prometheus.

Vous pouvez également demander une augmentation de quota. Connectez-vous à la console Service Quotas AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/servicequotas/.

La taille des alertes est trop grande (avertissement)

Lorsque le journal contient l’avertissement suivant

{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "alerts too big, total size limit: 20000000 bytes", "level": "WARN" }, "component": "alertmanager" }

Cela signifie que le quota d'alertes par espace de travail, en termes de taille, a été dépassé.

Action à exécuter

Supprimez les annotations et les étiquettes inutiles afin de réduire la taille des alertes.

Avertissement de contenu vide

Lorsque le journal contient l’avertissement suivant

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been modified because the content was empty." "level": "WARN" }, "component": "alertmanager" }

Cela signifie que le modèle de gestionnaire d’alertes a résolu l’alerte sortante en message vide.

Action à exécuter

Validez votre modèle de gestionnaire d’alertes et assurez-vous que vous disposez d’un modèle valide pour tous les chemins de réception.

Avertissement key/value non valide

Lorsque le journal contient l’avertissement suivant

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "MessageAttributes has been removed because of invalid key/value, numberOfRemovedAttributes=1" "level": "WARN" }, "component": "alertmanager" }

Cela signifie que certains attributs du message ont été supprimés car ils n' keys/values étaient pas valides.

Action à exécuter

Réévaluez les modèles que vous utilisez pour renseigner les attributs des messages et assurez-vous qu’ils correspondent à des attributs de message SNS valides. Pour plus d’informations sur la validation d’un message envoyé à une rubrique Amazon SNS, consultez la section Validating SNS topic.

Avertissement de limite de message

Lorsque le journal contient l’avertissement suivant

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been truncated because it exceeds size limit, originSize=266K, truncatedSize=12K" "level": "WARN" }, "component": "alertmanager" }

Cela signifie qu’une partie de la taille du message est trop grande.

Action à exécuter

Examinez le modèle de message du récepteur d’alertes et modifiez-le pour qu’il respecte la limite de taille.

Aucune erreur de stratégie basée sur les ressources

Lorsque le journal contient l’erreur suivante

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to perform: SNS:Publish on resource: arn:aws:sns:us-west-2:12345:testSnsReceiver because no resource-based policy allows the SNS:Publish action" "level": "ERROR" }, "component": "alertmanager" }

Cela signifie qu’Amazon Managed Service for Prometheus n’est pas autorisé à envoyer l’alerte à la rubrique SNS spécifiée.

Action à exécuter

Vérifiez que la stratégie d’accès de la rubrique SNS autorise Amazon Managed Service for Prometheus à envoyer des messages SNS à la rubrique. Créez une politique d'accès aux réseaux sociaux donnant au service aps.amazonaws.com (Amazon Managed Service for Prometheus) l'accès à votre rubrique Amazon SNS. Pour plus d'informations sur les politiques d'accès aux réseaux sociaux, consultez les sections Utilisation du langage des politiques d'accès et exemples de cas pour le contrôle d'accès Amazon SNS dans le guide du développeur Amazon Simple Notification Service.

Avertissement de format non ASCII

Lorsque le journal contient l’avertissement suivant

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Subject has been modified because it contains control or non-ASCII characters." "level": "WARN" }, "component": "alertmanager" }

Cela signifie que l’objet comporte des caractères non ASCII.

Action à exécuter

Dans le champ d’objet de votre modèle, supprimez les références aux étiquettes susceptibles de contenir des caractères non ASCII.

Non autorisé à appeler KMS

Lorsque le journal contient l' AWS KMS erreur suivante

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to call KMS", "level": "ERROR" }, "component": "alertmanager" }

Action à exécuter

Vérifiez que la politique clé de la clé utilisée pour chiffrer le sujet Amazon SNS autorise le aps.amazonaws.com principal de service Amazon Managed Service for Prometheus à effectuer les actions suivantes : et. kms:GenerateDataKey* kms:Decrypt Pour plus d’informations, veuillez consulter la section AWS Autorisations KMS pour SNS.

Erreur de modèle

Lorsque le journal contient l’erreur suivante

{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Notify for alerts failed. There is an error in a receiver that is using templates in the AlertManager definition. Make sure that the syntax is correct and only template functions and variables that exist are used in the receiver 'default', sns_configs position #2, section 'attributes'" "level": "ERROR" }, "component": "alertmanager" }

Cela signifie qu'un modèle utilisé dans la AlertManager définition contient une erreur. L'entrée d'erreur contient des instructions concernant le récepteur, la position dans le fichier sns_configs et la propriété contenant les erreurs.

Action à exécuter

Validez votre définition d'Alert Manager. Assurez-vous que la syntaxe est correcte et que vous faites référence aux variables de modèle et aux fonctions existantes. Pour plus d'informations, consultez la référence du modèle de notification dans la documentation open source de Prometheus.