本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
网络、存储和计算
此部分提供有关为暂存环境和目标环境配置网络、存储和计算,以便通过弹性灾难恢复实现 AWS 云端 SAP 工作负载的灾难恢复目标的信息。
网络
在支持高效达成 RTO 和 RPO SLA 方面,用于灾难恢复的网络架构和配置发挥着重要作用。您必须考虑触发灾难恢复时的网络设计和将流量重定向到恢复实例。
以下是设计用于灾难恢复的网络的四个步骤。
连接源网络和目标网络
第一步是选择和配置从源网络到复制服务器的网络连接方法。您可以在私有网络和公有网络之间选择。有关更多信息,请参阅数据路由和节流。
无论采用何种方法,传输的数据在传输过程中始终加密。默认方法是公有网络,即数据通过互联网路由到复制服务器上的公共网络接口。在私有网络方法中,数据通过私有网络进行复制。私有网络的选择取决于所使用的灾难恢复方案。
-
AWS 区域内灾难恢复:私有网络通常是 VPC 之间的连接,使用 Amazon VPC 对等连接或 AWS Transit Gateway 进行连接。建议为灾难恢复使用不同的 AWS 账户和单独的 Amazon VPC。有关更多信息,请参阅什么是 Amazon VPC 对等?和什么是 Transit Gateway?
-
AWS 跨区域灾难恢复:建议使用完全冗余的 AWS 网络主干,将不同 AWS 区域连接在一起。Amazon VPC 对等连接和 AWS Transit Gateway 支持区域间的连接。有关详细信息,请参阅 Introduction to Network Transformation on AWS
。 -
AWS 外部向 AWS 的灾难恢复:在此场景中,您的源网络与 AWS 之间的物理网络由不同电信提供商或互联网服务提供商(ISP)提供。AWS 上提供以下解决方案。
-
AWS Marketplace
上提供的 SD-WAN
SAP on AWS 客户通常使用 AWS Direct Connect。相比采用 VPN 或 SD-WAN 的解决方案,此服务为基于服务水平协议(SLA)的目标(例如吞吐量、抖动和延迟)提供了更可预测的性能。您可以与 AWS Direct Connect 交付合作伙伴
合作,获取有关哪些选项最适合您的环境的指导。
定义暂存子网和恢复子网
建议使用称为暂存区子网的子网来托管复制服务器。称为“恢复子网”的其他子网是必需的灾难恢复操作目标。对于源网络位于 AWS 云端的场景,请考虑如何根据您选择的 AWS 账户策略和登录区来分配子网。通常,这可能意味着暂存区子网应与您的源服务器位于不同的 Amazon VPC 中。对于简化的环境,这可能只是在相同 Amazon VPC 中使用不同的子网。这意味着减少了生产与非生产灾难恢复环境之间的隔离。有关更多信息,请参阅 AWS Well-Architected Framework:最佳实践 5.3。
最终,这些子网的数量和设计应遵循与源环境相似的概念。有关更多信息,请参阅网络示意图。
对于 AWS 区域内灾难恢复场景,我们建议将暂存区子网托管在与恢复子网不同的可用区中。这种设计为灾难恢复提供了额外的冗余。启动的恢复实例将由单独的可用区中的暂存区提供保护。这遵循了使用多个可用区来保持韧性的设计原则。
配置网络安全设置
确保配置了所需的网络安全设置。这包括在本地防火墙、网络安全设备、安全组或网络访问控制列表(网络 ACL)中允许通过多个端口进行访问,根据您的源环境位置,可能还需要完成其他任务。有关更多信息,请参阅复制网络要求。
SAP 最终用户和集成流量
以下介绍了一些因素,会影响到与最终用户和集成相关的网络流量如何对您的 RTO 和 RPO 产生影响。
-
客户端识别并解析为新 IP 的 DNS 传播时间
-
用于重新路由流量的网络组件(如有)中的延迟,例如全局或本地负载均衡器,包括 AWS 应用程序负载均衡器、AWS Global Accelerator 或 Amazon Route 53 公共数据面板
有关更多信息,请参阅云中的灾难恢复选项。
存储
AWS 弹性灾难恢复设计用于根据源服务器性能,为您的暂存环境评估和定义最佳 Amazon EBS 卷设置。演习和恢复服务器使用默认性能设置。这些卷可以调整大小来满足源系统的容量需求。您必须根据 SAP 工作负载的特定要求查看这些设置。这可确保实现高效且符合灾难恢复 SLA 的环境。这些不同的服务器类型具有不同的要求和管理存储的方法。
复制服务器
暂存区需要存储空间来支持从源计算机持续进行复制。这些 Amazon EBS 卷通常是低成本的硬盘驱动器(HDD)类型的存储卷。但是,如果复制的磁盘写入吞吐量很高,则默认的复制服务器设置会动态进行更改,转为采用性能更高的固态硬盘(SSD)存储类型。对于复制服务器,Amazon EBS 卷类型的默认设置自动卷类型选择是推荐用于 SAP 工作负载的设置。它会根据工作负载的要求,自动选择高性能、经济高效的 Amazon EBS 卷。
您可以通过选择固态驱动器(SSD)来提高暂存区的性能。这对 SAP 工作负载有明显的好处,例如数据库在遇到突发或持续高事务速率时,具有高速率的创建、更新和/或删除操作需要应用到存储。对于此类工作负载,建议您监控 Amazon CloudWatch 指标,并检查是否存在任何持续或不断增加的延迟。您可以将以下 CloudWatch 指标用于弹性灾难恢复。
-
LagDuration:最新的一致性快照的寿命,以秒为单位
-
Backlog:尚未同步的数据量,以字节为单位
如果复制服务器上的 Amazon EBS 指标也表明存在性能问题,您可以更改 Amazon EBS 卷类型。要了解更多信息,请参阅以下资源。
演习和恢复实例
对于 90% 或更多的使用案例,包括 SAP 应用程序和数据库(SAP HANA 和任何其他),SAP 工作负载至少需要 gp3 卷类型。如果您要求每个卷的 IOPS 超过 16000 IOPS,或者要求每个卷的吞吐量大于 1000 MiB/s,请考虑 io2 或 io2 Block Express 卷。
当您启动演习或恢复实例时,弹性灾难恢复会根据启动模板中定义的类型创建 Amazon EBS 存储卷。有关更多信息,请参阅 Amazon EC2 启动模板。启动模板由弹性灾难恢复自动生成,对于存储性能采用默认设置,使用通用型 SSD(卷大小与源系统容量要求相匹配)。检查启动模板,确认启动模板的默认分配满足了工作负载的存储需求。
您可以针对不同的卷类型或性能设置修改启动模板。修改之前,请确认您的目标 Amazon EC2 实例类型是否支持更高的存储空间。有关更多信息,请参阅支持的实例类型。对于 SAP HANA 数据库,请参阅存储配置。将更改应用于模板后,将修改后的版本定义为服务器的默认启动模板。在将模板与弹性灾难恢复结合使用时,建议不要在模板中添加或移除 Amazon EBS 卷。
对于在使数据可供使用之前需要加载大量数据的服务器(例如数据库服务器),您可以在启动模板中配置更高的性能设置和存储类型。例如,如果您的服务器配置了 gp3 存储,则可以为存储定义更多的预调配吞吐量和 IOPS,和/或使用 io2 Block Express 等(采用支持的 Amazon EC2 实例类型)性能更高的扩展存储,这样可以缩短演习或恢复实例处理预期工作负载数量所需的时间。演习或恢复实例完全上线后,您可以进行更改来恢复存储设置。有关更多信息,请参阅 Amazon EBS 弹性卷。您还可以在不分离卷或重启实例的情况下,增加卷大小、更改卷类型或者调节 Amazon EBS 卷的性能。
时间点恢复
AWS 弹性灾难恢复使用 Amazon EBS 快照来提供可在演习或恢复期间使用的时间点(PiT)恢复选项。Amazon EBS 的暂存快照连续拍摄卷,用来提供最新(亚秒级 RPO)的恢复点,第一个小时内以 10 分钟为增量,24 小时内以 1 小时为增量。每日 PiT 将保留在您的时间点(PiT)策略中指定的天数。您可以指定 1 到 365 天之间的值,默认值为 7 天。有关更多信息,请参阅了解时间点状态。
计算
您必须为复制服务器和恢复服务器选择 Amazon EC2 实例类型。
复制服务器
复制服务器通常比源系统小。t3.small 是默认的实例类型,最多可以复制 15 个卷。您可以在 SAP 应用程序服务器之间或者其他更改率较低的服务器之间使用共享的复制服务器。
如果您遇到了突发工作负载或者数据库的事务速率一直很高,存在大量创建、更新和/或删除操作需要应用到存储,则可能需要对暂存区进行不同的配置。如果您发现工作负载的复制出现延迟,请将默认复制服务器更改为其他实例系列。例如,通用型 Amazon EC2 实例系列或使用专用复制服务器。这种更改可能会影响成本。有关更多信息,请参阅复制服务器配置。
演习和恢复实例
对于恢复实例,请配置 Amazon EC2 启动模板设置,使 AWS 目标实例与源实例相匹配。有关 SAP 认证实例的列表,请参阅以下资源。
以下介绍了一些与计算相关的因素,可能会影响到灾难恢复解决方案的 RTO。
-
服务器启动时间
-
SAP 运行在 Microsoft Windows Server 操作系统上
-
大型 SAP HANA 数据库,启动时间超过 10 分钟
-
SAP 应用程序安装在服务器上,及其启动时间
-
源服务器和目标服务器以及存储配置不匹配,目标端配置的计算能力或存储性能较低会增加 RTO
您必须将应用程序启动时间作为恢复过程中的因素来考虑。我们建议选择能够提供快速启动时间的 Amazon EC2 实例类型和存储配置。这有助于优化灾难恢复解决方案的 RTO。此外,通过执行灾难恢复测试或演习,您可以根据自己的操作系统和数据库来衡量 RTO。
SAP 系统可以在各种操作系统、基础设施平台和处理器指令集上运行。如果您的源服务器位于本地或其他云提供商的云端,则它必须与 Amazon EC2 和弹性灾难恢复兼容。源服务器必须采用针对 x86 系统架构构建的 64 位操作系统。AWS 提供了各种基于 x86 的 CPU 供源服务器使用,尤其是当服务器是旧型号的情况下。建议使用基于 SAP 调整大小的方法,将源系统映射到 Amazon EC2 实例类型。要了解更多信息,请参阅 SAP 的 Sizing
源服务器
虽然对复制代理的系统要求相对较低,但需要考虑源服务器上的 CPU、内存、网络、存储和其他资源限制,这些限制可能会影响灾难恢复解决方案的性能。根据这些因素调整源服务器的大小。有关更多信息,请参阅源服务器要求。