OPS08-BP04 Estabelecer as referências das métricas da workload
Estabelecer uma referência para as métricas da workload auxilia na compreensão da integridade e do desempenho da workload. Com as referências, é possível identificar aplicações e componentes com desempenho acima e abaixo do esperado. Uma referência da workload permite que você mitigue problemas antes que eles se tornem incidentes. As referências são fundamentais no desenvolvimento de padrões de atividade e na implementação da detecção de anomalias quando as métricas desviam dos valores esperados.
Resultado desejado:
-
Você tem um nível de referência das métricas da workload em condições normais.
-
É possível determinar se a workload está funcionando normalmente.
Antipadrões comuns:
-
Depois de implantar um novo recurso, ocorre uma queda na latência da solicitação. Não foi estabelecida uma referência para uma métrica composta de solicitações processadas recebidas e latência geral. Não é possível determinar se a mudança causou uma melhoria ou um defeito.
-
Ocorre um pico repentino na atividade de usuários, mas você não estabeleceu uma referência para a métrica. O pico de atividade leva lentamente a um vazamento de memória em uma aplicação. Isso acaba deixando a workload offline.
Benefícios do estabelecimento desta prática recomendada:
-
Você entende o padrão normal de atividade para a workload usando métricas para os principais componentes e aplicações.
-
É possível determinar se a workload, suas aplicações e seus componentes estão se comportando normalmente ou exigem intervenção.
Nível de risco exposto se esta prática recomendada não é estabelecida: médio
Orientações para a implementação
Use dados históricos para estabelecer uma referência das métricas da workload para aplicações e componentes na workload. Utilize a referência das métricas nas reuniões de análise das métricas e na resolução de problemas. Analise periodicamente o desempenho da workload e ajuste a referência à medida que a arquitetura evolui.
Exemplo de clientes
As referências são estabelecidas para todos os componentes e as aplicações na Loja UmaEmpresa. Usando dados históricos, a Loja UmaEmpresa desenvolveu as referências das métricas da workload em um prazo de métricas de dois meses. A cada dois meses, as referências são reavaliadas e ajustadas com base em dados reais.
Etapas da implementação
-
Faça uma análise retroativa partindo das métricas da workload, estabeleça uma referência das métricas para os principais componentes e aplicações usando dados históricos. Limite o número de métricas por componente ou aplicação e evite o excesso de monitoramento.
-
É possível usar o Amazon CloudWatch Metrics Insight para consultar métricas em escala e identificar tendências e padrões.
-
A detecção de anomalias do Amazon CloudWatch usa algoritmos de machine learning para identificar padrões de comportamento para métricas, determinar referências e expor anomalias.
-
O Amazon DevOps Guru permite detectar problemas operacionais com a workload usando machine learning.
-
Os clientes que contam com o Enterprise Support podem solicitar o workshop Building a Monitoring Strategy
(Como criar uma estratégia de monitoramento) ao respectivo gerente de conta técnico. Esse workshop ajudará você a elaborar uma estratégia de capacidade de observação para a workload.
-
-
Estabeleça um mecanismo para analisar periodicamente as referências das métricas da workload, principalmente antes de eventos empresariais significativos. Ao menos a cada trimestre, avalie a referência das métricas da workload usando dados históricos. Use a referência nas reuniões de análise das métricas.
Nível de esforço do plano de implementação: baixo. Estabelecer métricas da workload e as referências pode exigir a coleta de dados suficientes para identificar padrões normais de comportamento.
Recursos
Práticas recomendadas relacionadas:
-
OPS08-BP02 Definir as métricas da workload – As métricas da workload devem ser estabelecida antes de determinar as referências.
-
OPS08-BP03 Coletar e analisar as métricas da workload – É necessário coletar e analisar as métricas da workload antes de estabelecer as referências da métrica.
-
OPS08-BP05 Aprender os padrões esperados das atividades da workload – Essa prática recomendada se baseia na referência para desenvolver tendências de uso.
-
OPS08-BP06 Alertar quando os resultados da workload estiverem em risco – As referências das métricas são necessárias para identificar limites e desenvolver alertas.
-
OPS08-BP07 Alertar quando forem detectadas anomalias na workload – A detecção de anomalias exige o estabelecimento de referências das métricas.
Documentos relacionados:
-
AWS Observability Best Practices - Alarms
(Práticas recomendadas de capacidade de observação da AWS: alarmes) -
How to set up CloudWatch Anomaly Detection to set dynamic alarms, automate actions, and drive online sales
(Como configurar a detecção de anomalias do CloudWatch para definir alarmes dinâmicos, automatizar ações e gerar vendas online) -
Operationalizing CloudWatch Anomaly Detection
(Operacionalizar a detecção de anomalias do CloudWatch)
Vídeos relacionados:
-
AWS re:Invent 2020: Monitoring production services at Amazon
(AWS re:Invent 2020: monitoramento de serviços de produção na Amazon) -
AWS re:Invent 2021 - Get insights from operational metrics at scale with CloudWatch Metrics Insights
(AWS re:Invent 2021: obtenha informações de métricas operacionais em escala com o CloudWatch Metrics Insights) -
AWS re:Invent 2022: Developing an observability strategy (COP302)
(AWS re:Invent 2022: desenvolvimento de uma estratégia de capacidade de observação (COP302)) -
AWS Summit DC 2022 - Monitoring and observability for modern applications
(AWS Summit DC 2022: monitoramento e capacidade de observação para aplicações modernas) -
AWS Summit SF 2022 - Full-stack observability and application monitoring with AWS (COP310)
(AWS Summit SF 2022: capacidade de observação de pilha completa e monitoramento de aplicações com a AWS (COP310))
Exemplos relacionados:
-
AWS CloudTrail and Amazon CloudWatch Integration Workshop
(Workshop de integração do AWS CloudTrail e do Amazon CloudWatch)
Serviços relacionados: