Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Résoudre les problèmes liés au gestionnaire d'alertes avec les journaux CloudWatch
Surveillez les événements Prometheus via Amazon Managed Service grâce aux journaux CloudWatch vous permet de résoudre les problèmes liés au gestionnaire d’alertes et à l’outil de règle. Cette section contient des rubriques de dépannage relatives au gestionnaire d’alertes.
Alertes actives (avertissement)
Lorsque le journal contient l’avertissement suivant
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "too many alerts, limit: 1000", "level": "WARN" }, "component": "alertmanager" }
Cela signifie que le quota d'alertes actives du gestionnaire d'alertes est dépassé.
Action à exécuter
Demandez une augmentation de quota. Connectez-vous à la console Service Quotas AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/servicequotas/
Avertissement concernant la taille du groupe d'agrégation d'alertes
Lorsque le journal contient l’avertissement suivant
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Too many aggregation groups, cannot create new group for alert, groups=1000, limit=1000, alert=sample-alert", "level": "WARN" }, "component": "alertmanager" }
Cela signifie que le quota de taille du groupe d'agrégation d'alertes du gestionnaire d'alertes a été dépassé.
Action à exécuter
Réduisez la taille du groupe d'agrégation d'alertes en utilisant le group_by
paramètre. Pour plus d'informations, consultez la section Paramètres relatifs à l'itinéraire dans la documentation de Prometheus
Vous pouvez également demander une augmentation de quota. Connectez-vous à la console Service Quotas AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/servicequotas/
La taille des alertes est trop grande (avertissement)
Lorsque le journal contient l’avertissement suivant
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "alerts too big, total size limit: 20000000 bytes", "level": "WARN" }, "component": "alertmanager" }
Cela signifie que le quota d'alertes par espace de travail, en termes de taille, a été dépassé.
Action à exécuter
Supprimez les annotations et les étiquettes inutiles afin de réduire la taille des alertes.
Avertissement de contenu vide
Lorsque le journal contient l’avertissement suivant
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been modified because the content was empty." "level": "WARN" }, "component": "alertmanager" }
Cela signifie que le modèle de gestionnaire d’alertes a résolu l’alerte sortante en message vide.
Action à exécuter
Validez votre modèle de gestionnaire d’alertes et assurez-vous que vous disposez d’un modèle valide pour tous les chemins de réception.
Avertissement key/value
non valide
Lorsque le journal contient l’avertissement suivant
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "MessageAttributes has been removed because of invalid key/value, numberOfRemovedAttributes=1" "level": "WARN" }, "component": "alertmanager" }
Cela signifie que certains attributs du message ont été supprimés car ils n' keys/values étaient pas valides.
Action à exécuter
Réévaluez les modèles que vous utilisez pour renseigner les attributs des messages et assurez-vous qu’ils correspondent à des attributs de message SNS valides. Pour plus d’informations sur la validation d’un message envoyé à une rubrique Amazon SNS, consultez la section Validating SNS topic.
Avertissement de limite de message
Lorsque le journal contient l’avertissement suivant
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been truncated because it exceeds size limit, originSize=266K, truncatedSize=12K" "level": "WARN" }, "component": "alertmanager" }
Cela signifie qu’une partie de la taille du message est trop grande.
Action à exécuter
Examinez le modèle de message du récepteur d’alertes et modifiez-le pour qu’il respecte la limite de taille.
Aucune erreur de stratégie basée sur les ressources
Lorsque le journal contient l’erreur suivante
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to perform: SNS:Publish on resource: arn:aws:sns:us-west-2:12345:testSnsReceiver because no resource-based policy allows the SNS:Publish action" "level": "ERROR" }, "component": "alertmanager" }
Cela signifie qu’Amazon Managed Service for Prometheus n’est pas autorisé à envoyer l’alerte à la rubrique SNS spécifiée.
Action à exécuter
Vérifiez que la stratégie d’accès de la rubrique SNS autorise Amazon Managed Service for Prometheus à envoyer des messages SNS à la rubrique. Créez une politique d'accès aux réseaux sociaux donnant au service aps.amazonaws.com
(Amazon Managed Service for Prometheus) l'accès à votre rubrique Amazon SNS. Pour plus d'informations sur les politiques d'accès aux réseaux sociaux, consultez les sections Utilisation du langage des politiques d'accès et exemples de cas pour le contrôle d'accès Amazon SNS dans le guide du développeur Amazon Simple Notification Service.
Avertissement de format non ASCII
Lorsque le journal contient l’avertissement suivant
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Subject has been modified because it contains control or non-ASCII characters." "level": "WARN" }, "component": "alertmanager" }
Cela signifie que l’objet comporte des caractères non ASCII.
Action à exécuter
Dans le champ d’objet de votre modèle, supprimez les références aux étiquettes susceptibles de contenir des caractères non ASCII.
Non autorisé à appeler KMS
Lorsque le journal contient l' AWS KMS erreur suivante
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to call KMS", "level": "ERROR" }, "component": "alertmanager" }
Action à exécuter
Vérifiez que la politique clé de la clé utilisée pour chiffrer le sujet Amazon SNS autorise le aps.amazonaws.com
principal de service Amazon Managed Service for Prometheus à effectuer les actions suivantes : et. kms:GenerateDataKey*
kms:Decrypt
Pour plus d’informations, veuillez consulter la section AWS
Autorisations KMS pour SNS.
Erreur de modèle
Lorsque le journal contient l’erreur suivante
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Notify for alerts failed. There is an error in a receiver that is using templates in the AlertManager definition. Make sure that the syntax is correct and only template functions and variables that exist are used in the receiver 'default', sns_configs position #2, section 'attributes'" "level": "ERROR" }, "component": "alertmanager" }
Cela signifie qu'un modèle utilisé dans la AlertManager définition contient une erreur. L'entrée d'erreur contient des instructions concernant le récepteur, la position dans le fichier sns_configs et la propriété contenant les erreurs.
Action à exécuter
Validez votre définition d'Alert Manager. Assurez-vous que la syntaxe est correcte et que vous faites référence aux variables de modèle et aux fonctions existantes. Pour plus d'informations, consultez la référence du modèle de notification