PERF04-BP03 Coletar e registrar métricas de performance do banco de dados - AWS Well-Architected Framework

PERF04-BP03 Coletar e registrar métricas de performance do banco de dados

Para compreender como está a performance dos sistemas de gerenciamento de dados, é importante rastrear métricas relevantes. Essas métricas ajudam a otimizar seus recursos de gerenciamento de dados para garantir que os requisitos da workload sejam atendidos, e que você tenha uma visão geral clara de como está a performance da sua workload. Use ferramentas, bibliotecas e sistemas que registram as medidas de performance relacionadas ao banco de dados.

Há métricas relacionadas ao sistema que hospeda o banco de dados (como, CPU, armazenamento, memória, IOPS), e há métricas para avaliar os próprios dados (como, transações por segundo, taxas de consultas, tempos de resposta, erros). Essas métricas devem estar prontamente acessíveis para qualquer equipe de suporte e operacional, e devem ter registro histórico suficiente para que seja possível identificar tendências, anomalias e gargalos.

Resultado desejado: Para monitorar a performance das workloads de seus bancos de dados, registre várias métricas de performance ao longo de um período. Isso permite detectar anomalias e avaliar a performance em relação às métricas de negócios para garantir que as necessidades da workload sejam atendidas.

Antipadrões comuns:

  • Você só usa a pesquisa manual de arquivos de log para métricas.

  • Você só publica métricas para ferramentas internas usadas pela equipe e não tem uma imagem abrangente da workload.

  • Você só usa as métricas padrão registradas pelo software de monitoramento selecionado.

  • Você só analisa as métricas quando há um problema.

  • Você só monitora as métricas em nível do sistema, não captura as métricas de acesso aos dados e de uso.

Benefícios do estabelecimento desta prática recomendada: O estabelecimento de uma linha de base de performance ajuda a compreender o comportamento normal e os requisitos das workloads. Padrões anormais podem ser identificados e depurados mais rapidamente, melhorando a performance e a confiabilidade do banco de dados. A capacidade do banco de dados pode ser configurada para garantir um custo ideal sem comprometer a performance.

Nível de exposição a riscos quando esta prática recomendada não é estabelecida: Alto

  • A inabilidade de diferenciar o nível de performance fora do normal versus normal criam dificuldades na identificação de problemas e na tomada de decisões.

  • A economia de custo possível pode não ser identificada.

  • Os padrões de crescimento não serão identificados resultando em degradação da confiabilidade e da performance.

Orientações para a implementação

Identifique, colete, agregue e correlacione métricas relacionadas ao banco de dados. As métricas devem incluir as métricas do sistema subjacente que oferece suporte ao banco de dados e do banco de dados. As métricas do sistema subjacente podem incluir métricas de utilização de CPU, memória, armazenamento em disco disponível, E/S de disco e entrada e saída da rede, enquanto as métricas de banco de dados devem incluir transações por segundo, tempos de resposta, uso de índice, bloqueios de tabela, tempos limite de consultas e número de conexões abertas. Esses dados são essenciais para compreender como está a performance da workload e como a solução de banco de dados é usada. Use essas métricas como parte de uma abordagem orientada por dados para ajustar e otimizar os recursos da sua workload. 

Etapas da implementação:

  1. Quais métricas de bancos de dados é importante rastrear?

  2. O monitoramento do banco de dados se beneficiaria de uma solução de machine learning que detecta problemas de performance por anomalias operacionais?

    1. O Amazon DevOps Guru for Amazon RDS fornece visibilidade dos problemas de performance e faz recomendações de ações corretivas.

  3. São necessários detalhes em nível de aplicação sobre o uso do SQL?

    1. AWS X-Ray pode ser instrumentado na aplicação para obter insights e encapsular todos os pontos de dados em uma única consulta;

  4. Você tem uma solução de registro em log e de monitoramento aprovada?

    1. Amazon CloudWatch pode coletar métricas nos recursos na sua arquitetura. Você também pode coletar e publicar métricas personalizadas para descobrir métricas de negócio ou derivadas. Use o CloudWatch ou soluções de terceiros para definir alarmes que indiquem quando os limites são violados.

  5. Você identificou e configurou suas políticas de retenção de dados para que correspondam às suas metas operacionais e de segurança?

Nível de esforço do plano de implementação: Há um nível de esforço médio para identificar, rastrear, coletar, agregar e correlacionar métricas de todos os recursos de banco de dados.

Recursos

Documentos relacionados:

Vídeos relacionados:

Exemplos relacionados: