View a markdown version of this page

Cómo funcionan las evaluaciones del modo de fallo - AWS Centro de resiliencia

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cómo funcionan las evaluaciones del modo de fallo

Al realizar una evaluación del modo de fallo, Resilience Hub de próxima generación lleva a cabo los siguientes pasos:

  1. Lee el estado actual de los recursos: actualiza la configuración de recursos del servicio desde su AWS cuenta.

  2. Analiza la topología: un sistema de IA multiagente examina cómo se conectan e interactúan sus recursos.

  3. Evalúa las políticas utilizando el marco de análisis de resiliencia: compara tu arquitectura con tus políticas de resiliencia. En primer lugar, realiza una evaluación para determinar si los componentes de la política son alcanzables o no.

  4. Aplica las AWS Well-Architected mejores prácticas: comprueba si hay antipatrones de resiliencia comunes.

  5. Genera hallazgos: identifica los modos de falla con su gravedad, razonamiento y recomendaciones, y asigna los resultados a sus políticas de resiliencia.

El motor de evaluación utiliza agentes de IA especializados que aplican las mejores prácticas de confiabilidad del AWS Well-Architected Framework y el AWS Resilience Analysis Framework a su arquitectura específica. Los agentes analizan diferentes aspectos de la resiliencia:

  • Disponibilidad: puntos únicos de fallo, distribución en zonas de disponibilidad y redundancia.

  • Recuperación ante desastres: Cross-region capacidades, replicación y preparación para la conmutación por error.

  • Resiliencia de la dependencia: impacto de las fallas de dependencia en el servicio.

  • Observabilidad: monitorear las brechas que podrían retrasar la detección de fallas.

La evaluación del modo de fallo no consume todos los recursos disponibles. En su lugar, evalúa un subconjunto de recursos conocido como recursos evaluados.

Recurso evaluado: un componente de infraestructura o servicio de alto nivel que se evalúa directamente durante una evaluación de resiliencia. Se evalúa un recurso si su configuración tiene un impacto significativo en la disponibilidad, la capacidad de recuperación o la tolerancia a errores del servicio. Los recursos fuera de este ámbito no tendrán ningún impacto en la evaluación y no aparecerán en la lista de recursos.