As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Visão geral
O monitoramento e o alerta estão incluídos em quatro pilares do AWS Well-Architected Framework
-
O pilar de excelência operacional determina que sua workload deve ser projetada para incluir telemetria e monitoramento. Os serviços da AWS, como o Amazon Relational Database Service (Amazon RDS
), fornecem as informações necessárias para que você entenda o estado interno da sua workload (tais como métricas, logs, eventos e rastreamento). Ao operar seus bancos de dados do Amazon RDS, você desejará entender a integridade das instâncias de seus bancos de dados, detectar eventos operacionais e ser capaz de responder a eventos planejados e não planejados. A AWS fornece ferramentas de monitoramento que ajudam a determinar quando os resultados organizacionais e comerciais estão em risco ou podem estar em risco, para que você possa tomar as medidas apropriadas no momento certo. -
O pilar de eficiência de performance determina que você deve monitorar a performance de seus recursos, como instâncias de banco de dados do Amazon RDS, reunindo, agregando e processando métricas relacionadas à performance em tempo real. Você pode identificar a degradação da performance e remediar os fatores, por exemplo, consultas SQL não otimizadas ou parâmetros de configuração inadequados, que a causaram. Você pode acionar alarmes automaticamente quando as medições estão fora dos limites esperados. Recomendamos que você use alarmes não apenas para notificações, mas também para iniciar ações automatizadas em resposta aos eventos detectados. Você pode avaliar as métricas coletadas em relação a limites predefinidos ou usar algoritmos de machine learning para identificar comportamentos anômalos. Por exemplo, para detectar uma tendência de aumento na utilização da CPU, você pode coletar e analisar a métrica
cpuUtilization.totalpor um período. Alertar sobre essa anomalia de forma proativa, antes que a utilização da CPU atinja o limite máximo, pode ajudar você a remediar o problema antes que ele afete seus clientes. -
O pilar de confiabilidade define o monitoramento e os alertas como essenciais para garantir que você esteja cumprindo seus requisitos de disponibilidade. Sua solução de monitoramento deve ser capaz de detectar falhas de forma eficaz. Ao detectar problemas ou falhas, seu objetivo principal é alertar sobre essas questões. Implementar práticas contínuas de observabilidade e monitoramento é fundamental para arquiteturas resilientes na nuvem. Para melhorar suas workloads, você deve ser capaz de avaliá-las e entender seu estado e integridade. Os princípios de design para recuperação automática de uma falha, escalabilidade horizontal e provisionamento de capacidade dependem de serviços precisos de monitoramento e alerta.
-
O pilar de segurança discute a detecção e prevenção de alterações de configuração inesperadas ou indesejadas e comportamento inesperado. Você pode configurar suas instâncias de banco de dados do Amazon RDS para MySQL e MariaDB com o plug-in de auditoria do MariaDB para registrar atividades do banco de dados, como logins de usuários e operações específicas executadas no banco de dados. O plug-in armazena o registro da atividade do banco de dados em um arquivo de logs, que pode ser integrado e importado para ferramentas de monitoramento e alerta. O arquivo de logs é analisado em tempo real para detectar comportamentos inesperados ou suspeitos em seu banco de dados. Esse comportamento inesperado ou suspeito pode indicar que sua instância de banco de dados do Amazon RDS foi comprometida, o que sinaliza riscos potenciais para sua empresa. Se a ferramenta de monitoramento detectar esse evento, ela ativará um alarme para iniciar uma resposta ao incidente de segurança, o que ajuda a lidar com atividades suspeitas e maliciosas.
Resultados de negócios desejados
A implementação das práticas recomendadas em mecanismos de monitoramento e alerta ajuda você a garantir uma infraestrutura de alta performance, resiliente, eficiente, segura e com otimização de custos para suas aplicações e workloads. Você pode usar ferramentas de observabilidade que coletam, armazenam e visualizam métricas, eventos, rastreamentos e logs em tempo real para observar e analisar o panorama geral da integridade e da performance de seus bancos de dados e, assim, evitar a degradação ou interrupção dos serviços de TI associados. Se a degradação não planejada ou a interrupção do serviço ainda ocorrer, as ferramentas de monitoramento e alerta ajudarão você a detectar o problema em tempo hábil, escalar, reagir e investigar e resolver rapidamente. Uma solução abrangente de monitoramento e alerta para suas workloads de banco de dados em nuvem ajuda você a alcançar os seguintes resultados de negócios:
-
Melhorar a experiência do cliente. Um serviço confiável melhora as experiências de seus clientes. Os bancos de dados geralmente são um componente essencial dos serviços digitais, como aplicações da web e móveis, streaming de mídia, pagamentos, APIs business-to-business (B2B) e serviços de integração. Se você puder monitorar e configurar alertas em seus bancos de dados para detectar problemas rapidamente, investigá-los com eficiência e remediá-los o mais rápido possível para minimizar o tempo de inatividade e outras interrupções, poderá melhorar a disponibilidade, a segurança e a performance do serviço digital para seus clientes.
-
Conquistar a confiança do cliente.Uma melhor performance e uma experiência de usuário sem atritos ajudam você a conquistar a confiança de seus clientes, o que pode resultar em mais negócios em sua plataforma. Por exemplo, um provedor de serviços de processamento de pagamentos que oferece um serviço on-line confiável pode esperar uma alta confiança e fidelidade dos clientes, o que resulta em mais clientes e melhor retenção, um aumento nas transações faturáveis e serviços novos e inovadores que geram mais receita.
-
Evitar perdas financeiras.Qualquer tempo de inatividade inesperado em sua infraestrutura de banco de dados pode afetar as transações comerciais que seus clientes realizam usando sua aplicação. Isso pode levar a perdas financeiras substanciais em alguns casos. A violação dos acordos de serviço (SLAs) pode resultar na perda da confiança do cliente e, consequentemente, na perda de receita. Também pode se tornar uma base legal para testes caros, em que os clientes podem exigir compensação com base em seus contratos de responsabilidade e garantia. De acordo com um estudo da Atlassian Corporation
, uma empresa de software, os custos médios da interrupção do serviço estão na faixa de USD 140 mil a USD 540 mil por hora, dependendo do tipo e porte da empresa. Um ambiente de banco de dados estável é essencial para evitar interrupções prolongadas e perda de negócios. -
Expandir o valor. Mecanismos de monitoramento e alerta podem ajudar você a projetar, desenvolver e operar um serviço digital altamente disponível, resiliente, confiável, de alta performance, econômico e seguro, mas isso é só o começo. Você vai querer que sua organização cresça e prospere com o tempo, aprimore as workloads existentes na nuvem e introduza novos serviços. Novos serviços fornecem valor adicional para seus clientes e mais receita para sua empresa, criando um efeito de aceleração contínua no crescimento da sua empresa.
-
Melhorar a produtividade do desenvolvedor.Desenvolvedores que são produtivos e eficientes, e que não encontram problemas e gargalos em suas tarefas de desenvolvimento, podem entregar produtos de alta qualidade em menos tempo. No entanto, a engenharia de software e as operações de TI geralmente têm desafios complexos, e essa complexidade aumenta com a escala das workloads e suas arquiteturas. Para analisar a performance e a consistência em aplicações distribuídas, os desenvolvedores precisam de ferramentas que possam fornecer métricas e rastreamentos correlacionados. Elas ajudam a identificar artefatos de código e componentes de infraestrutura com defeito o mais rápido possível, e ajudam a determinar os impactos nos usuários finais. O conjunto certo de ferramentas de monitoramento e alerta pode ajudar os desenvolvedores a programar e testar de forma melhor e mais rápida.
-
Melhorar a eficácia e a eficiência operacionais.Quando você opera workloads na nuvem em grande escala, até mesmo uma pequena porcentagem de melhorias na performance pode resultar em economias de milhões de dólares. Ao monitorar seus bancos de dados e analisar métricas, eventos, logs e rastreamentos, você pode entender e prever suas necessidades futuras de capacidade e aproveitar as economias de custo disponíveis na Nuvem AWS. Compreender as workloads e a integridade operacional do Amazon RDS pode ajudar você a responder a eventos, corrigir problemas e planejar melhorias.