Risolvi i problemi relativi al gestore degli avvisi con Logs CloudWatch - Amazon Managed Service per Prometheus

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risolvi i problemi relativi al gestore degli avvisi con Logs CloudWatch

Utilizzando Monitora gli eventi di Amazon Managed Service for Prometheus con i log CloudWatch , è possibile risolvere i problemi relativi ad alert manager e Ruler. Questa sezione contiene argomenti relativi alla risoluzione dei problemi relativi ad alert manager.

Avvisi attivi (avviso)

Quando il registro contiene il seguente avviso

{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "too many alerts, limit: 1000", "level": "WARN" }, "component": "alertmanager" }

Ciò significa che la quota di avvisi attivi di Alert Manager è stata superata.

Operazione da eseguire

Richiedi un aumento delle quote. Accedi AWS Management Console e apri la console Service Quotas all'indirizzo. https://console.aws.amazon.com/servicequotas/

Aggregazione degli avvisi (avviso sulla dimensione del gruppo)

Quando il registro contiene il seguente avviso

{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Too many aggregation groups, cannot create new group for alert, groups=1000, limit=1000, alert=sample-alert", "level": "WARN" }, "component": "alertmanager" }

Ciò significa che la quota di dimensione del gruppo di aggregazione degli avvisi di Alert Manager è stata superata.

Operazione da eseguire

Ridurre la dimensione del gruppo di aggregazione degli avvisi utilizzando il parametro. group_by Per ulteriori informazioni, vedere Impostazioni relative al percorso nella documentazione di Prometheus.

È possibile anche richiedere un aumento delle quote. Accedi AWS Management Console e apri la console Service Quotas all'indirizzo. https://console.aws.amazon.com/servicequotas/

Le dimensioni degli avvisi sono troppo grandi (avviso).

Quando il registro contiene il seguente avviso

{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "alerts too big, total size limit: 20000000 bytes", "level": "WARN" }, "component": "alertmanager" }

Ciò significa che è stata superata la quota di dimensioni degli avvisi di Alert manager per area di lavoro.

Operazione da eseguire

Rimuovi le annotazioni e le etichette non necessarie per ridurre le dimensioni degli avvisi.

Avviso di contenuto vuoto

Quando il registro contiene il seguente avviso

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been modified because the content was empty." "level": "WARN" }, "component": "alertmanager" }

Ciò significa che il modello di gestione degli avvisi ha risolto l'avviso in uscita in un messaggio vuoto.

Operazione da eseguire

Convalida il modello di alert manager e assicurati di disporre di un modello valido per tutti i percorsi dei destinatari.

Avviso non valido key/value

Quando il registro contiene il seguente avviso

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "MessageAttributes has been removed because of invalid key/value, numberOfRemovedAttributes=1" "level": "WARN" }, "component": "alertmanager" }

Ciò significa che alcuni attributi del messaggio sono stati rimossi perché non keys/values validi.

Operazione da eseguire

Valuta nuovamente i modelli che stai utilizzando per compilare gli attributi del messaggio e assicurati che si risolva in un attributo di messaggio SNS valido. Per ulteriori informazioni sulla convalida di un messaggio per un argomento Amazon SNS, consulta l'argomento Convalida di SNS

Avviso di limite dei messaggi

Quando il registro contiene il seguente avviso

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been truncated because it exceeds size limit, originSize=266K, truncatedSize=12K" "level": "WARN" }, "component": "alertmanager" }

Ciò significa che parte della dimensione del messaggio è troppo grande.

Operazione da eseguire

Guarda il modello di messaggio del destinatario dell'avviso e rielaboralo per adattarlo al limite di dimensione.

Nessun errore di policy basata su risorse

Quando il registro contiene il seguente errore

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to perform: SNS:Publish on resource: arn:aws:sns:us-west-2:12345:testSnsReceiver because no resource-based policy allows the SNS:Publish action" "level": "ERROR" }, "component": "alertmanager" }

Ciò significa che il servizio gestito da Amazon per Prometheus non dispone delle autorizzazioni per inviare l'avviso all'argomento SNS specificato.

Operazione da eseguire

Verifica che la policy di accesso sull’argomento Amazon SNS conceda ad Amazon Managed Service for Prometheus la possibilità di inviare messaggi SNS all'argomento. Crea una politica di accesso SNS che consenta al servizio aps.amazonaws.com (Amazon Managed Service for Prometheus) di accedere al tuo argomento Amazon SNS. Per ulteriori informazioni sulle politiche di accesso a SNS, consulta Using the Access Policy Language e Casi di esempio per il controllo degli accessi di Amazon SNS nella Amazon Simple Notification Service Developer Guide.

Avviso non ASCII

Quando il registro contiene il seguente avviso

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Subject has been modified because it contains control or non-ASCII characters." "level": "WARN" }, "component": "alertmanager" }

Ciò significa che l'oggetto contiene caratteri non ASCII.

Operazione da eseguire

Rimuovi i riferimenti nel campo dell'oggetto del modello alle etichette che potrebbero contenere caratteri non ASCII.

Non autorizzato a chiamare KMS

Quando il registro contiene il seguente errore AWS KMS

{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to call KMS", "level": "ERROR" }, "component": "alertmanager" }

Operazione da eseguire

Verifica che la policy chiave della chiave utilizzata per crittografare l'argomento Amazon SNS consenta al responsabile del servizio Amazon Managed Service for Prometheus di eseguire le seguenti azioni:, e. aps.amazonaws.com kms:GenerateDataKey* kms:Decrypt Per ulteriori informazioni, consulta AWS Autorizzazioni KMS per argomenti SNS.

Errore nel modello

Quando il registro contiene il seguente errore

{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Notify for alerts failed. There is an error in a receiver that is using templates in the AlertManager definition. Make sure that the syntax is correct and only template functions and variables that exist are used in the receiver 'default', sns_configs position #2, section 'attributes'" "level": "ERROR" }, "component": "alertmanager" }

Ciò significa che c'è un errore in un modello utilizzato nella AlertManager definizione. La voce di errore contiene indicazioni sul ricevitore, sulla posizione in sns_configs e sulla proprietà che contiene gli errori.

Operazione da eseguire

Convalida la definizione di Alert Manager. Assicurati che la sintassi sia corretta e di fare riferimento alle variabili e alle funzioni del modello esistenti. Per ulteriori informazioni, vedere il Notification Template Reference nella documentazione open source di Prometheus.