自动执行关系数据库的灾难恢复解决方案 AWS - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自动执行关系数据库的灾难恢复解决方案 AWS

亚马逊 Web Services 的 Jitendra Kumar、Oliver Francis 和 Pavithra Balasubramanian ()AWS

2024 年 5 月文档历史记录

在 Amazon Web Services () 上规划灾难恢复 (DR AWS) 策略时,您可以为组织中的数据库实施灾难恢复 (DR) 解决方案。您可以通过配置事件驱动的架构来执行数据库实例的故障转移,从而实现灾难恢复解决方案的自动化。这种方法的好处包括以下几点:

  • 减少因手动协调而导致的人为错误

  • 在某些情况下提供尽可能短的恢复时间目标 (RTO)

  • 促进灾难恢复解决方案的可重复测试

如果没有自动化,则主服务器 AWS 区域中断将需要组织中的资源手动执行运行手册中的步骤。这些步骤可能包括多个流程,例如在辅助数据库中提升 Amazon Relational Database Service (Amazon RDS) 只读副本 AWS 区域 以用作新的主数据库实例。 AWS 提供AWS 适用于 Python 的 SDK (Boto3) APIs 来自动执行这些操作,这些操作可以构成满足组织需求的灾难恢复解决方案的组成部分。

本指南讨论了一种以清单为导向的集中式灾难恢复协调器,它可以帮助你在同一个 AWS 数据库中 AWS 区域 实现灾难恢复解决方案。 AWS 账户执行故障转移的决定仍需要人工干预,并且超出了自动化的范围。

本指南的目标受众是应用程序架构师、基础设施架构师、数据库架构师和数据库顾问。

目标

实施 DR Orchestrator 框架解决方案可以帮助您实现以下成果:

  • 减少停机期间的手动错误 — 灾难恢复过程的手动执行很容易出错。在灾难恢复活动的各个阶段自动执行操作可以减少手动错误,并有助于确保更顺畅的故障转移或故障恢复。

  • 大规模管理灾难恢复 — 如果您的组织拥有大量数据库,那么构建灾难恢复自动化可以帮助您扩展灾难恢复解决方案。您可以使用 DR Orchestrator 框架自动执行 AWS 数据库灾难恢复解决方案。DR Orchestrator 使用 JSON 格式的参数文件自动执行 AWS 数据库的故障转移或故障恢复步骤。