Crie um alarme baseado em uma consulta ao Metrics Insights de várias séries temporais - Amazon CloudWatch

Crie um alarme baseado em uma consulta ao Metrics Insights de várias séries temporais

Você pode criar um alarme que monitora várias séries temporais em uma frota de recursos. Diferentemente dos alarmes de instância única que acionam ações em instâncias individuais, os alarmes de monitoramento de frota permitem agregar métricas em vários recursos e acionar com base nas condições de toda a frota.

Configuração de um alarme de várias séries temporais usando o Console de gerenciamento da AWS

Este exemplo mostra como criar um alarme que monitora a utilização da memória em uma frota de instâncias, e alerta você quando mais de duas instâncias excedem um limite.

Para criar um alarme de várias séries temporais
  1. Abra o console do CloudWatch, em https://console.aws.amazon.com/cloudwatch/.

  2. No painel de navegação, escolha Alarms (Alarmes), All alarms (Todos os alarmes).

  3. Selecione Criar alarme.

  4. Escolha Selecionar métrica.

  5. Em Métricas, insira uma consulta do Metrics Insights:

    SELECT MAX(mem_used_percent) FROM "CWAgent" GROUP BY InstanceId ORDER BY MAX() DESC
  6. Escolha Próximo.

  7. Em Conditions (Condições), especifique o seguinte:

    • Em Tipo de limite, escolha Estático.

    • Em Quando a métrica for, escolha Maior que e insira 80.

    • Em Pontos de dados para o alarme, insira 2.

  8. Configure notificações e ações conforme necessário.

  9. Adicione um nome e uma descrição para o alarme.

  10. Selecione Criar alarme.

Esse alarme difere dos alarmes de instância única de várias maneiras:

  • Ele monitora várias séries temporais simultaneamente por meio do uso de uma consulta de métricas. A consulta de métricas é atualizada toda vez que o alarme é avaliado, portanto, seu alarme se adapta automaticamente à medida que os recursos são criados, pausados ou excluídos.

  • Para cada colaborador que ultrapassa o limite, o alarme envia um evento de alteração de estado do colaborador, que tem um tipo de evento diferente no EventBridge do que um evento de alteração de estado do alarme. O alarme em si também muda de estado: assim que pelo menos um colaborador está em alarme, o alarme também entra no estado de alarme.

  • No entanto, algumas ações, como o SSM Incident, são acionadas no nível do alarme. Essas ações não se repetem quando a lista de colaboradores no alarme muda.

Esse alarme difere dos alarmes agregados de consulta de métrica de várias maneiras:

  • Ele monitora séries temporais individualmente em vez de agregadas, usando a cláusula GROUP BY.

  • Ele segue o nível de granularidade que você define de acordo com suas necessidades: por exemplo, ele pode alertar em cada instância do Amazon EC2 (o nível mais granular das métricas do Amazon EC2) ou por tabela do Amazon RDS (agregada em várias operações em uma tabela), dependendo dos campos definidos na cláusula GROUP BY.

  • Ele prioriza a avaliação usando a cláusula ORDER BY.

  • Para cada colaborador que ultrapassa o limite, o alarme envia um evento de alteração de estado do colaborador, que tem um tipo de evento diferente no EventBridge do que um evento de alteração de estado do alarme. O alarme em si também muda de estado: assim que pelo menos um colaborador está em alarme, o alarme também entra no estado de alarme.

  • No entanto, algumas ações, como o SSM Incident, são acionadas no nível do alarme. Essas ações não se repetem quando a lista de colaboradores no alarme muda.