Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Conclusión
En este documento, se proporciona una visión general de los errores grises, cómo se manifiestan y por qué es necesario crear herramientas de observabilidad y evacuación para mitigar ese tipo de eventos cuando ocurren. En la siguiente sección, se analiza la observabilidad Multi-AZ y los tres enfoques que puede implementar para detectar el impacto en una sola zona de disponibilidad. En la última sección, este documento incluye dos enfoques generales para realizar la evacuación de una zona de disponibilidad. El primer enfoque utiliza acciones del plano de datos para evitar que el trabajo se dirija a la zona de disponibilidad afectada, mientras que el segundo enfoque utiliza acciones del plano de control para evitar que se aprovisione capacidad en la zona de disponibilidad afectada. En conjunto, estos dos enfoques logran los dos resultados que busca la evacuación de la zona de disponibilidad.
Es probable que los patrones de recuperación descritos en este documento formen parte de una solución más amplia de supervisión y recuperación de errores. Este enfoque para hacer frente a los errores grises en una zona de disponibilidad única requiere trabajos de ingeniería para crear la instrumentación necesaria para detectarlos, así como herramientas para responder a ellos. Sin embargo, para muchas cargas de trabajo, este enfoque puede ser una alternativa más sencilla y menos costosa a la creación de arquitecturas multirregionales. Además, puede ayudar a lograr RPO y RTO más pequeños (lo que aumenta la disponibilidad de la carga de trabajo) en comparación con la DR multirregional.