As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Etapa 3: inspecionar, adaptar e iterar
Depois de implementar seu sistema de observabilidade, recomendamos que você revise, avalie, aprenda, adapte e melhore continuamente sua implementação. Você pode usar o Modelo de Maturidade de AWS Observabilidade
Implemente revisões regulares
A observabilidade é um processo iterativo. Ela exige auditorias e avaliações regulares dos componentes existentes, além de mudanças e aprimoramentos para impulsionar a melhoria contínua. Recomendamos que você realize revisões regulares para reavaliar limites de alertas SLOs, painéis, granularidade métrica, políticas de retenção, estratégias de amostragem e assim por diante, para garantir que elas gerem valor para suas equipes e negócios. Ao conectar os custos de observabilidade a equipes e serviços específicos, você pode permitir decisões baseadas em dados sobre cobertura e alocação de recursos.
Na Amazon, realizamos avaliações semanais de prontidão operacional (ORRs) para auditar os processos e as posturas de observabilidade das equipes em relação às melhores práticas. Este é um exercício sem bloqueio que se alinha ao número de serviços e à frequência de lançamentos na Amazon.
Dependendo do tamanho da sua organização, você também pode ter uma lista de negócios como de costume (BAU), na qual um membro de cada equipe é responsável por relatar anomalias e tendências, descobrir incógnitas, remover instrumentação e alertas indesejados, melhorar os painéis e garantir que a solução de observabilidade continue funcionando para a equipe e esteja alinhada aos objetivos e métricas de sucesso da equipe. Essa também pode ser uma oportunidade de reavaliar a estratégia de alerta para ser mais responsiva, proativa e mais próxima do usuário. O objetivo dessas avaliações é criar um ciclo virtuoso, conforme mostrado na ilustração a seguir, e melhorar a maturidade de sua postura de observabilidade, conforme descrito no Modelo de Maturidade de AWS Observabilidade
Identifique os manuais que são acessados com mais frequência e considere melhorar seu aplicativo ou adicionar mais instrumentação. Identifique os runbooks que são executados com mais frequência e considere automatizar esses runbooks.
Os aprendizados dessas análises também são compartilhados com o esquadrão de observabilidade e especialistas, para destacar as melhorias nos programas centrais e na plataforma de observabilidade. Por exemplo, dependendo da frequência dos eventos acionados pela implantação, você pode decidir priorizar a melhoria do pipeline de implantação em relação a outros componentes. Se o MTTR for maior devido a lacunas de monitoramento, você poderá priorizar a melhoria da plataforma de observabilidade e sua configuração.
Comemore as vitórias
Compartilhe histórias de sucesso de equipes que usam ferramentas de observabilidade. Por exemplo, destaque o sucesso de uma equipe que usou métricas de observabilidade para implementar uma solução alternativa que é mais eficiente e leva a uma menor latência ou custo. A comunicação desse sucesso ressalta a importância da observabilidade e motiva outras equipes a melhorar sua postura de observabilidade e a buscar um sucesso semelhante.
Aprenda com os incidentes
Conduza exercícios pós-incidentes sem culpa, semelhantes ao processo de correção de erros (COE