PERF02-BP05 利用可用的资源弹性
云让您能够通过各种机制灵活地动态扩展或缩减资源,以便满足不断变化的需求。结合与计算相关的指标,工作负载可以自动响应这些变化,并利用一系列最优的资源来实现其目标。
实现最佳供需匹配能够尽可能降低工作负载成本,但您也必须准备充足的供应,以便应对预置时间问题和单个资源的故障。需求可以是固定的,也可以是变化的,所以需要通过指标和自动化来确保管理本身不会成为一种负担,而且不会产生不成比例的高成本。
借助 AWS,您可以使用大量不同方法以实现供需匹配。《成本优化支柱》白皮书描述了如何使用以下方法进行成本优化:
-
基于需求的方法
-
基于缓冲区的方法
-
基于时间的方法
您必须确保工作负载部署可以处理扩展和缩减事件。创建缩减事件的测试方案,以确保工作负载按预期方式运行。
常见反模式:
-
您通过手动增加容量来对警报做出反应。
-
在扩展事件之后,您将保留增加的容量,而不是缩减容量。
建立此最佳实践的好处: 配置和测试工作负载弹性将有助于节省资金,维护性能基准,并在流量变化时提高可靠性。大多数非生产实例在不使用时都应该停止。尽管可以手动关闭未使用的实例,但在规模较大时这是无法实现的。您也可以利用基于卷的弹性,此功能通过在需求激增时自动增加计算资源数量,并在需求减少时减小容量,从而能够优化性能并降低成本。
未建立此最佳实践暴露的风险等级: 中
实施指导
利用弹性:弹性可根据您对资源的需求来向您提供这些资源。实例、容器和函数都能够与自动扩展功能相结合或作为此服务的一项功能来提供可实现弹性的机制。在您的架构中利用弹性,可确保您有足够的容量来满足所有使用规模的性能要求。确保衡量扩展或缩减弹性资源的指标已根据所部署的工作负载类型进行了验证。如果您正在部署一个视频转码应用程序,CPU 利用率预计为 100%,并且不应将此作为您的主要指标。或者,您也可以衡量等待缩放您的实例类型的转码作业的队列深度。确保工作负载部署可以处理扩展事件和缩减事件。安全地缩减工作负载组件,与在需要时扩展资源同样重要。创建缩减事件的测试方案,以确保工作负载按预期方式运行。
资源
相关文档:
相关视频:
相关示例: