PERF02-BP03 Coletar métricas relacionadas à computação - AWS Well-Architected Framework

PERF02-BP03 Coletar métricas relacionadas à computação

Para entender a performance dos recursos de computação, registre e acompanhe a utilização de vários sistemas. Esses dados podem ser usados para fazer determinações mais precisas sobre os requisitos de recursos. 

As workloads podem gerar grandes volumes de dados, como métricas, logs e eventos. Determine se o serviço de armazenamento, monitoramento e observação existente é capaz de gerenciar os dados gerados. Identifique quais métricas refletem a utilização de recursos e podem ser coletadas, agregadas e correlacionadas em uma única plataforma. Essas métricas devem representar todos os recursos de workload, aplicações e serviços, para que você possa visualizar facilmente todo o sistema e identificar oportunidades e problemas na melhoria de performance.

Resultado desejado: todas as métricas referentes aos recursos relacionados à computação são identificadas, coletadas, agregadas e correlacionadas em uma única plataforma com retenção implementada para oferecer suporte a metas operacionais e de custo.

Antipadrões comuns:

  • Você só usa a pesquisa manual de arquivos de log para métricas. 

  • Você só publica métricas em ferramentas internas.

  • Você só usa as métricas padrão registradas pelo software de monitoramento selecionado.

  • Você só revisa as métricas quando há um problema.

Benefícios do estabelecimento dessa prática recomendada: para monitorar a performance das workloads, você precisa registrar várias métricas de performance ao longo de um período. Essas métricas permitem detectar anomalias na performance. Elas também ajudarão a avaliar a performance em relação às métricas de negócios para garantir que as necessidades da workload sejam atendidas.

Nível de exposição a riscos quando esta prática recomendada não for estabelecida: Alto

Orientações para a implementação

Identifique, colete, agregue e correlacione métricas relacionadas à computação. Usar um serviço como o Amazon CloudWatch pode tornar a implementação mais rápida e fácil de manter. Além das métricas padrão registradas, identifique e acompanhe métricas adicionais em nível de sistema na workload. Registre dados como níveis de uso da CPU, memória, E/S de disco e métricas de entrada e saída de rede para obter uma percepção sobre os níveis de utilização ou os gargalos. Esses dados são cruciais para entender a performance da workload e como a solução de computação é utilizada. Use essas métricas como parte de uma abordagem impulsionada por dados para ajustar e otimizar ativamente os recursos de sua carga de trabalho. 

Etapas da implementação:

  1. Quais métricas de solução de computação são importantes de acompanhar?

  2. Tenho, atualmente, uma solução de registro em log e monitoramento aprovada?

  3. Identifiquei e configurei minhas políticas de retenção de dados para corresponder às minhas metas operacionais e de segurança?

  4. Como você implanta agentes de agregação de métrica e log?

Nível de esforço para o plano de implementação: Há um nível de esforço médio para identificar, rastrear, coletar, agregar e correlacionar métricas de todos os recursos de computação.

Recursos

Documentos relacionados:

Vídeos relacionados:

Exemplos relacionados: