As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Solucione problemas do gerenciador de alertas com CloudWatch o Logs
Utilizando Monitore eventos do Amazon Managed Service para Prometheus com registros CloudWatch , você pode solucionar problemas relacionados ao gerenciador de alertas e ao Ruler. Esta seção contém tópicos de solução de problemas relacionados ao gerenciador de alertas.
Tópicos
Aviso de alertas ativos
Quando o log contém o seguinte aviso
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "too many alerts, limit: 1000", "level": "WARN" }, "component": "alertmanager" }
Isso significa que a cota de alertas ativos do Alert Manager foi excedida.
Medida a ser tomada
Solicite um aumento da cota. Faça login AWS Management Console e abra o console Service Quotas em. https://console.aws.amazon.com/servicequotas/
Aviso de tamanho do grupo de agregação de alertas
Quando o log contém o seguinte aviso
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Too many aggregation groups, cannot create new group for alert, groups=1000, limit=1000, alert=sample-alert", "level": "WARN" }, "component": "alertmanager" }
Isso significa que a cota de tamanho do grupo de agregação de alertas do Alert Manager foi excedida.
Medida a ser tomada
Reduza o tamanho do grupo de agregação de alertas usando o group_by
parâmetro. Para obter mais informações, consulte Configurações relacionadas à rota na documentação do Prometheus
Também é possível solicitar um aumento da cota. Faça login AWS Management Console e abra o console Service Quotas em. https://console.aws.amazon.com/servicequotas/
Tamanho dos alertas: aviso muito grande
Quando o log contém o seguinte aviso
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "alerts too big, total size limit: 20000000 bytes", "level": "WARN" }, "component": "alertmanager" }
Isso significa que a cota de alertas do Alert Manager por espaço de trabalho foi excedida.
Medida a ser tomada
Remova anotações e rótulos desnecessários para reduzir o tamanho do alerta.
Aviso de conteúdo vazio
Quando o log contém o seguinte aviso
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been modified because the content was empty." "level": "WARN" }, "component": "alertmanager" }
Isso significa que o modelo do gerenciador de alertas resolveu o alerta de saída em uma mensagem vazia.
Medida a ser tomada
Valide o seu modelo do gerenciador de alertas e garanta que você tenha um modelo válido para todos os caminhos do receptor.
Aviso de key/value
inválido
Quando o log contém o seguinte aviso
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "MessageAttributes has been removed because of invalid key/value, numberOfRemovedAttributes=1" "level": "WARN" }, "component": "alertmanager" }
Isso significa que alguns dos atributos da mensagem foram removidos por keys/values serem inválidos.
Medida a ser tomada
Reavalie os modelos que você está usando para preencher os atributos da mensagem e certifique-se de que eles estão resultando em um atributo de mensagem do SNS válido. Para obter mais informações sobre como validar uma mensagem em um tópico do Amazon SNS, consulte o tópico Validar SNS
Aviso de limite de mensagens
Quando o log contém o seguinte aviso
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Message has been truncated because it exceeds size limit, originSize=266K, truncatedSize=12K" "level": "WARN" }, "component": "alertmanager" }
Isso significa que parte do tamanho da mensagem é muito grande.
Medida a ser tomada
Veja o modelo de mensagem do receptor de alerta e reformule-o para caber dentro do limite de tamanho.
Nenhum erro da política baseada no recurso
Quando o log contém o seguinte erro
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to perform: SNS:Publish on resource: arn:aws:sns:us-west-2:12345:testSnsReceiver because no resource-based policy allows the SNS:Publish action" "level": "ERROR" }, "component": "alertmanager" }
Isso significa que o Amazon Managed Service for Prometheus não tem as permissões para enviar o alerta para o tópico do SNS especificado.
Medida a ser tomada
Verifique se a política de acesso no tópico do Amazon SNS concede ao Amazon Managed Service for Prometheus a capacidade de enviar mensagens do SNS para o tópico. Crie uma política de acesso do SNS para que o serviço aps.amazonaws.com
(Amazon Managed Service for Prometheus) acesse seu tópico do Amazon SNS. Para obter mais informações sobre políticas de acesso do SNS, consulte Como usar a linguagem de políticas de acesso e Casos de exemplo para o controle de acesso do Amazon SNS no Guia do desenvolvedor do Amazon Simple Notification Service.
Aviso não ASCII
Quando o log contém o seguinte aviso
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Subject has been modified because it contains control or non-ASCII characters." "level": "WARN" }, "component": "alertmanager" }
Isso significa que o assunto tem caracteres não ASCII.
Medida a ser tomada
Remova as referências no campo de assunto do seu modelo dos rótulos que possam conter caracteres não ASCII.
Não autorizado a chamar o KMS
Quando o log contém o seguinte erro do AWS KMS
{ "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000", "message": { "log": "Notify for alerts failed, AMP is not authorized to call KMS", "level": "ERROR" }, "component": "alertmanager" }
Medida a ser tomada
Valide se a política de chave da chave usada para criptografar o tópico do Amazon SNS permite que a entidade principal do serviço do Amazon Managed Service for Prometheus aps.amazonaws.com
execute as seguintes ações: kms:GenerateDataKey*
e kms:Decrypt
. Para obter mais informações, consulte AWS
Permissões KMS para Tópico SNS.
Erro de modelo
Quando o log contém o seguinte erro
{ "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002", "message": { "log": "Notify for alerts failed. There is an error in a receiver that is using templates in the AlertManager definition. Make sure that the syntax is correct and only template functions and variables that exist are used in the receiver 'default', sns_configs position #2, section 'attributes'" "level": "ERROR" }, "component": "alertmanager" }
Isso significa que há um erro em um modelo sendo usado na AlertManager definição. A entrada de erro contém instruções sobre qual receptor, a posição no sns_configs e a propriedade que contém erros.
Medida a ser tomada
Valide sua definição do Alert Manager. Verifique se a sintaxe está correta e se você faz referência às variáveis e funções do modelo que existem. Para obter mais informações, consulte a Referência do modelo de notificação na documentação