Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Risolvi i problemi relativi al gestore degli avvisi con Logs CloudWatch
Utilizzando Monitora gli eventi di Amazon Managed Service for Prometheus con i log CloudWatch , è possibile risolvere i problemi relativi ad alert manager e Ruler. Questa sezione contiene argomenti relativi alla risoluzione dei problemi relativi ad alert manager.
Avvisi attivi (avviso)
Quando il registro contiene il seguente avviso
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "too many alerts, limit: 1000", "level": "WARN" }, "component": "alertmanager" }
Ciò significa che la quota di avvisi attivi di Alert Manager è stata superata.
Operazione da eseguire
Richiedi un aumento delle quote. Accedi AWS Management Console e apri la console Service Quotas all'indirizzo. https://console.aws.amazon.com/servicequotas/
Aggregazione degli avvisi (avviso sulla dimensione del gruppo)
Quando il registro contiene il seguente avviso
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Too many aggregation groups, cannot create new group for alert, groups=1000, limit=1000, alert=sample-alert", "level": "WARN" }, "component": "alertmanager" }
Ciò significa che la quota di dimensione del gruppo di aggregazione degli avvisi di Alert Manager è stata superata.
Operazione da eseguire
Ridurre la dimensione del gruppo di aggregazione degli avvisi utilizzando il parametro. group_by
Per ulteriori informazioni, vedere Impostazioni relative al percorso nella documentazione di Prometheus
È possibile anche richiedere un aumento delle quote. Accedi AWS Management Console e apri la console Service Quotas all'indirizzo. https://console.aws.amazon.com/servicequotas/
Le dimensioni degli avvisi sono troppo grandi (avviso).
Quando il registro contiene il seguente avviso
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "alerts too big, total size limit: 20000000 bytes", "level": "WARN" }, "component": "alertmanager" }
Ciò significa che è stata superata la quota di dimensioni degli avvisi di Alert manager per area di lavoro.
Operazione da eseguire
Rimuovi le annotazioni e le etichette non necessarie per ridurre le dimensioni degli avvisi.
Avviso di contenuto vuoto
Quando il registro contiene il seguente avviso
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been modified because the content was empty." "level": "WARN" }, "component": "alertmanager" }
Ciò significa che il modello di gestione degli avvisi ha risolto l'avviso in uscita in un messaggio vuoto.
Operazione da eseguire
Convalida il modello di alert manager e assicurati di disporre di un modello valido per tutti i percorsi dei destinatari.
Avviso non valido key/value
Quando il registro contiene il seguente avviso
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "MessageAttributes has been removed because of invalid key/value, numberOfRemovedAttributes=1" "level": "WARN" }, "component": "alertmanager" }
Ciò significa che alcuni attributi del messaggio sono stati rimossi perché non keys/values validi.
Operazione da eseguire
Valuta nuovamente i modelli che stai utilizzando per compilare gli attributi del messaggio e assicurati che si risolva in un attributo di messaggio SNS valido. Per ulteriori informazioni sulla convalida di un messaggio per un argomento Amazon SNS, consulta l'argomento Convalida di SNS
Avviso di limite dei messaggi
Quando il registro contiene il seguente avviso
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been truncated because it exceeds size limit, originSize=266K, truncatedSize=12K" "level": "WARN" }, "component": "alertmanager" }
Ciò significa che parte della dimensione del messaggio è troppo grande.
Operazione da eseguire
Guarda il modello di messaggio del destinatario dell'avviso e rielaboralo per adattarlo al limite di dimensione.
Nessun errore di policy basata su risorse
Quando il registro contiene il seguente errore
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to perform: SNS:Publish on resource: arn:aws:sns:us-west-2:12345:testSnsReceiver because no resource-based policy allows the SNS:Publish action" "level": "ERROR" }, "component": "alertmanager" }
Ciò significa che il servizio gestito da Amazon per Prometheus non dispone delle autorizzazioni per inviare l'avviso all'argomento SNS specificato.
Operazione da eseguire
Verifica che la policy di accesso sull’argomento Amazon SNS conceda ad Amazon Managed Service for Prometheus la possibilità di inviare messaggi SNS all'argomento. Crea una politica di accesso SNS che consenta al servizio aps.amazonaws.com
(Amazon Managed Service for Prometheus) di accedere al tuo argomento Amazon SNS. Per ulteriori informazioni sulle politiche di accesso a SNS, consulta Using the Access Policy Language e Casi di esempio per il controllo degli accessi di Amazon SNS nella Amazon Simple Notification Service Developer Guide.
Avviso non ASCII
Quando il registro contiene il seguente avviso
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Subject has been modified because it contains control or non-ASCII characters." "level": "WARN" }, "component": "alertmanager" }
Ciò significa che l'oggetto contiene caratteri non ASCII.
Operazione da eseguire
Rimuovi i riferimenti nel campo dell'oggetto del modello alle etichette che potrebbero contenere caratteri non ASCII.
Non autorizzato a chiamare KMS
Quando il registro contiene il seguente errore AWS KMS
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to call KMS", "level": "ERROR" }, "component": "alertmanager" }
Operazione da eseguire
Verifica che la policy chiave della chiave utilizzata per crittografare l'argomento Amazon SNS consenta al responsabile del servizio Amazon Managed Service for Prometheus di eseguire le seguenti azioni:, e. aps.amazonaws.com
kms:GenerateDataKey*
kms:Decrypt
Per ulteriori informazioni, consulta AWS
Autorizzazioni KMS per argomenti SNS.
Errore nel modello
Quando il registro contiene il seguente errore
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Notify for alerts failed. There is an error in a receiver that is using templates in the AlertManager definition. Make sure that the syntax is correct and only template functions and variables that exist are used in the receiver 'default', sns_configs position #2, section 'attributes'" "level": "ERROR" }, "component": "alertmanager" }
Ciò significa che c'è un errore in un modello utilizzato nella AlertManager definizione. La voce di errore contiene indicazioni sul ricevitore, sulla posizione in sns_configs e sulla proprietà che contiene gli errori.
Operazione da eseguire
Convalida la definizione di Alert Manager. Assicurati che la sintassi sia corretta e di fare riferimento alle variabili e alle funzioni del modello esistenti. Per ulteriori informazioni, vedere il Notification Template Reference