Implemente revisões regulares Comemore as vitórias Aprenda com os incidentes

Etapa 3: inspecionar, adaptar e iterar

Depois de implementar seu sistema de observabilidade, recomendamos que você revise, avalie, aprenda, adapte e melhore continuamente sua implementação. Você pode usar o Modelo de Maturidade de AWS Observabilidade como uma ferramenta para avaliar a maturidade de sua implementação e identificar e priorizar áreas de melhoria.

Implemente revisões regulares

A observabilidade é um processo iterativo. Ela exige auditorias e avaliações regulares dos componentes existentes, além de mudanças e aprimoramentos para impulsionar a melhoria contínua. Recomendamos que você realize análises regulares para reavaliar SLOs, limites de alerta, painéis, granularidade métrica, políticas de retenção, estratégias de amostragem e assim por diante, para garantir que elas gerem valor para suas equipes e negócios. Ao conectar os custos de observabilidade a equipes e serviços específicos, você pode permitir decisões baseadas em dados sobre cobertura e alocação de recursos.

Na Amazon, realizamos avaliações semanais de prontidão operacional (ORRs) para auditar os processos e as posturas de observabilidade das equipes em relação às melhores práticas. Este é um exercício sem bloqueio que se alinha ao número de serviços e à frequência de lançamentos na Amazon.

Dependendo do tamanho da sua organização, você também pode ter uma lista de negócios como de costume (BAU), na qual um membro de cada equipe é responsável por relatar anomalias e tendências, descobrir incógnitas, remover instrumentação e alertas indesejados, melhorar os painéis e garantir que a solução de observabilidade continue funcionando para a equipe e esteja alinhada aos objetivos e métricas de sucesso da equipe. Essa também pode ser uma oportunidade de reavaliar a estratégia de alerta para ser mais responsiva, proativa e mais próxima do usuário. O objetivo dessas avaliações é criar um ciclo virtuoso, conforme mostrado na ilustração a seguir, e melhorar a maturidade de sua postura de observabilidade, conforme descrito no Modelo de Maturidade de AWS Observabilidade.

Ciclo de feedback e revisão no processo de observabilidade iterativa.

Identifique os manuais que são acessados com mais frequência e considere melhorar seu aplicativo ou adicionar mais instrumentação. Identifique os runbooks que são executados com mais frequência e considere automatizar esses runbooks.

Os aprendizados dessas análises também são compartilhados com o esquadrão de observabilidade e especialistas, para destacar as melhorias nos programas centrais e na plataforma de observabilidade. Por exemplo, dependendo da frequência dos eventos acionados pela implantação, você pode decidir priorizar a melhoria do pipeline de implantação em relação a outros componentes. Se o MTTR for maior devido a lacunas de monitoramento, você poderá priorizar a melhoria da plataforma de observabilidade e sua configuração.

Comemore as vitórias

Compartilhe histórias de sucesso de equipes que usam ferramentas de observabilidade. Por exemplo, destaque o sucesso de uma equipe que usou métricas de observabilidade para implementar uma solução alternativa que é mais eficiente e leva a uma menor latência ou custo. A comunicação desse sucesso ressalta a importância da observabilidade e motiva outras equipes a melhorar sua postura de observabilidade e a se esforçarem para obter sucesso semelhante.

Aprenda com os incidentes

Conduza exercícios pós-incidentes sem culpa, semelhantes ao processo de correção de erros (COE) na Amazon, para identificar áreas de melhoria e evitar problemas futuros. Assim como acontece com as vitórias, os aprendizados desse exercício podem ser amplamente compartilhados com outras equipes para reforçar o valor da observabilidade e das melhores práticas.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Etapa 2: Implementar a observabilidade

Próximas etapas e recursos