View a markdown version of this page

结论 - 高级多可用区弹性模式

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

结论

本文概述了灰色故障及其表现方式,并概述了为什么您需要建立可观测性和撤离工具,以便发生这些类型的事件时缓解其影响。在下一部分中,您回顾了多可用区可观测性以及可以检测单个可用区影响的三种方法。在最后一部分,本文介绍了两种执行可用区撤离的常规方法。第一种方法使用数据面板操作来防止将工作路由到受影响的可用区,而第二种方法则使用控制面板操作来防止在受影响的可用区中配置容量。这两种方法共同实现了可用区撤离预期达到的两个结果。

本文中描述的恢复模式很可能是更大型的监控和故障恢复解决方案的一部分。这种处理单可用区灰色故障的方法需要开展工程工作来构建检测这些故障所需的仪器以及应对这些故障的工具。但是,对于许多工作负载,与构建多区域架构相比,这种替代方法是更简单、成本更低。此外,与多区域灾难恢复相比,它可以帮助实现更低的 RPO 和 RTO(从而提高工作负载的可用性)。