AWS 优化与许可评测 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS 优化与许可评测

概览

AWS 优化与许可评测(AWS OLA)可以帮助您根据资源利用率、第三方许可和应用程序依赖关系来评测和优化您当前的本地和现有云环境。您可以使用 AWS OLA 帮助您的组织构建迁移和许可策略,以在迁移到 AWS 或评测 AWS 上现有的 Microsoft 工作负载时节省成本。AWS OLA 还可以帮助您实现以下目标:

  • 了解现有部署、应用程序性能和合同。

  • 调整您的资源。

  • 制定 AWS 云的路线图。

  • 通过使用现有投资且仅按实际用量付费,从而降低或消除成本。

我们建议您将 AWS OLA 作为成本优化之旅的第一步。您可以与 AWS Partner Network合作完成 AWS OLA。他们将帮助您收集评测数据,并为您提供优化许可和实例成本的建议。

下图提供了评测过程的概述。

完整的 AWS OLA 流程

评测选项

您可以为 AWS 上的 Microsoft 工作负载选择以下两个 AWS OLA 选项:

  • Lite 版本:在此使用案例中,您的所有工作负载都在 VMware 上。您可以为 AWS 提供 RVTools 的输出。然后,AWS 可以提供 1-5 天的周转时间。此方法使用直接从 VMware vCenter 拉取的时间点信息,来制定规模建议并提供按需定价选项。

  • 完整版本:在此使用案例中,您拥有一个混合环境,该环境运行在不同的云提供商、物理服务器和虚拟服务器中。AWS 使用操作系统代理来收集 14 到 30 天的使用情况数据。这使得 AWS 能够根据您的应用程序使用模式做出明智的实例大小调整决策。AWS 使用 Cloudamize 等多个第三方工具来完成分析。AWS 与其 AWS Partner Network合作,通过多个定价选项(考虑定价模型和不同架构)来帮助提供最终总拥有成本(TCO)评测。

全面评测

完整的 AWS OLA 评测首先会进行一小时的电话沟通。在这次通话中,AWS 将帮助您确定支持迁移的最佳 AWS 基础设施,选择数据收集方法,并制定完成时间线。在组织中实施发现工具取决于数据收集方法、组织规模以及组织用于管理其服务器群的工具。收集使用情况数据通常需要两周时间。

完整的 AWS OLA 流程需要 30-45 天,包括以下几个阶段:

  • 确定工作负载范围

  • 收集数据

  • 分析数据

  • 计划后续步骤

确定工作负载范围

首先,AWS 与您和您的团队合作确定评测的范围。这通常按环境类型(例如,非生产环境和生产环境)进行细分。范围包括工作负载的位置。这可能是您要迁移到 AWS 的工作负载、已经在 AWS 上运行的工作负载(例如适用于 Amazon EC2 的 AWS OLA),或者是在其他云提供商中运行的工作负载。

收集数据

接下来,AWS 部署工具来帮助发现资源并从服务器收集性能数据。此工具有四个部署选项:

  • 可以查询虚拟机监控程序的工具(仅需要 VMware vCenter 或 Hyper-V 凭证)

  • 可以部署在物理机或虚拟机上的代理

  • 根据您的环境和操作系统,使用 SSH、Windows 远程管理(WinRM)或 Windows 管理工具(WMI)进行无代理发现

  • 平面文件数据收集和分析

对于您的工具部署,您可以混合搭配各个选项并整合结果。确保无论您选择哪个选项,都必须确保不会给您的 IT 资源造成过大负担,这一点至关重要。AWS 致力于让评测流程尽可能简单便捷。除了简短的电话协助设置外,AWS OLA 团队和 Microsoft 专业解决方案架构师还将准备总拥有成本(TCO)分析和建议以供审查。

分析 CPU 利用率、RAM 利用率、存储吞吐量、IOPS 和网络吞吐量时,数据收集通常需要两到三周的时间。理想情况下,此收集发生在工作月的高峰时段(例如,在月末财务报告期间)。AWS 希望捕捉峰值使用情况,因为这可以提供良好的统计样本,从而确定合适的 AWS 实例大小,同时确保其性能优于本地可用水平。AWS 会将利用率指标与各种处理器世代的性能启发式方法相结合,以精确确定给定工作负载所需的 CPU 和 RAM 数量。这些目标通常低于本地分配的目标。这不仅可以降低实例大小的计算成本,还可以优化许可成本。

以下控制面板视图显示了可通过评测捕获的基础设施成本示例。

基础设施成本控制面板

分析数据

AWS 在数据收集完成后提供汇报演示文稿。AWS 审查数据,总结调查发现,然后就本地使用和云迁移提出建议。您可以通过研究整合机会、弹性增益(可以关闭或按季节调整工作负载)、合适的 SKU 机会(例如,正在使用 SQL Server 企业版,但资源要求和功能使用情况表明 SQL Server 标准版更合适)来降低计算和许可成本。对于像 SQL Server 这样按核心数量许可的产品,将工作负载放在更昂贵的计算实例中通常在经济上是合理的。也就是说,如果 CPU 配置和 RAM 与 vCPU 的比例能够有效减少许可核心的数量,无论是对于包含许可证的使用案例还是自带许可(BYOL)的使用案例,都是如此。

下面展示的是基于评测收集的数据的示例分析。

AWS OLA 分析输出

常见的优化场景包括确定 AWS 资源优化机会和节省第三方许可费用。

AWS 资源优化机会的示例:

  • 避免为应对高峰使用而过度预调配资源。

  • 避免过度指定资源和资源利用不足。

  • 调整您的实例并迁移到最新一代的 EC2 实例。

  • 通过迁移到托管式数据库来节省运营成本。

第三方许可费用节省示例:

  • 减少运行相同工作负载所需的内核。

  • 删除不必要的 SQL Server 企业版和附加组件包。

  • 删除僵尸服务器并更换过时的硬件。

  • 使用 BYOL 和包含许可证的选项来减少未来的商业协议。

  • 实现开源和云原生解决方案的现代化。

计划后续步骤

最后,AWS 使用收集的性能数据来估算特定的工作负载规模和成本。AWS 还可以汇总查看您的范围环境,并提供定量分析。这可以帮助您确定最佳选项是本地更新还是迁移到 AWS。您可以使用 AWS OLA 末尾提供的 TCO 分析摘要(如以下示例所示)来构建云经济业务案例。

来自 AWS OLA 的 TCO 分析摘要

AWS OLA 还通过提出以下建议,深入了解现代化可能对现有工作负载产生的影响:

  • 迁移到 Linux 操作系统。

  • 添加对 ARM 处理器(AWS Graviton)的应用程序支持。

  • 将 SQL Server 工作负载转移到 Amazon Aurora。

  • 通过将 Windows 和 SQL Server 工作负载迁移到开源技术来消除软件保障。

下图显示了通过现代化技术可以节省的成本,例如从 Windows 迁移到 Linux 或从 SQL Server 迁移到 Aurora。

迁移成本图

完整的 AWS OLA 流程从开始到结束大约需要 45 天。下图显示了一个时间线示例。

完整的 AWS OLA 流程工作流程

如果您有一个纯粹的 VMware 环境且可以提供 RVTools 的输出,则可以将此时间线缩短到一个工作周。此外,AWS 还可以分析包含资产和利用率数据的平面文件,例如 CPU 平均值、CPU 峰值、RAM 平均值和 RAM 峰值。

评测影响

通过优化规模,普通客户通常可以节省 20-30% 的成本。根据使用情况数据,调整可将源工作负载与大小最佳的 AWS 实例相匹配。这些优化规模的调整不仅可以降低 AWS 环境的每月成本,而且通常还能为组织的其他方面节省开支。例如,Windows 或 SQL Server 许可收入增加 20% 至 30%,可以减少下次与 Microsoft 的结算费用,或者释放许可收入用于其他业务线应用程序。通过整合和调整 SQL Server 工作负载,通常可以实现最显著的经济效益。

AWS 可以帮助您将系统归类为现代化存储桶。有些系统是遗留系统,进行改造在经济上不可行;而另一些系统则可以现代化改造为容器或无服务器应用程序,从而实现最显著的成本节省。与 AWS 团队的对话将从云计算的通用功能等宽泛话题,逐步深入到如何以及为何要对特定工作负载进行现代化改造等更具体的讨论。AWS 还能帮助您探索潜在的创新机会。

后续步骤

如果您正着手优化运行在本地环境或 AWS 上的 Microsoft 工作负载的成本,请联系您的 AWS 客户团队并申请 AWS OLA。AWS 团队成员可以解答您的疑问,并帮助您决定 AWS OLA 是否最终适合您和您的组织。或者,您可以在线申请 AWS OLA

其他资源