View a markdown version of this page

Como funcionam as avaliações do modo de falha - AWS Resilience Hub

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como funcionam as avaliações do modo de falha

Quando você executa uma avaliação do modo de falha, o Next Generation Resilience Hub executa as seguintes etapas:

  1. Lê o estado atual do recurso — atualiza a configuração de recursos do seu serviço a partir da sua AWS conta.

  2. Analisa a topologia — Um sistema de IA multiagente examina como seus recursos se conectam e interagem.

  3. Avalia as políticas usando a estrutura de análise de resiliência — compara sua arquitetura com suas políticas de resiliência. Primeiro, ele realiza uma avaliação para determinar se os componentes da política são viáveis ou não.

  4. Aplica as AWS Well-Architected melhores práticas — verifica os antipadrões comuns de resiliência.

  5. Gera descobertas — identifica os modos de falha com severidade, raciocínio e recomendações, e mapeia os resultados para suas políticas de resiliência.

O mecanismo de avaliação usa agentes de IA especializados que aplicam as melhores práticas de confiabilidade do AWS Well-Architected Framework e o AWS Resilience Analysis Framework à sua arquitetura específica. Os agentes analisam diferentes aspectos da resiliência:

  • Disponibilidade — pontos únicos de falha, distribuição de AZ e redundância.

  • Recuperação de desastres — Cross-region recursos, replicação e prontidão para failover.

  • Resiliência de dependência — Impacto das falhas de dependência em seu serviço.

  • Observabilidade — Monitoramento de lacunas que podem atrasar a detecção de falhas.

A avaliação do modo de falha não consome todos os recursos disponíveis. Em vez disso, ele avalia um subconjunto de recursos conhecido como recursos avaliados.

Recurso avaliado: um componente de infraestrutura ou serviço de alto nível que é avaliado diretamente durante uma avaliação de resiliência. Um recurso é avaliado se sua configuração tem um impacto significativo na disponibilidade, capacidade de recuperação ou tolerância a falhas do serviço. Recursos fora desse escopo não terão nenhum impacto na avaliação e não aparecerão na lista de recursos.