本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
第一阶段:设定目标
想象一下,在重大产品发布之前,你的团队正处于最后的冲刺阶段。这些新功能是开创性的,投资者的兴奋情绪也在增强。然后,在例行部署期间,您的核心服务就会停机。当客户投诉充斥你的电子邮件时,有两个问题变得非常明确:你能负担得起离线多长时间? 您能承受丢失哪些数据的代价?
希望一切都能正常运转并不是一个好策略。你需要一种系统的方法来决定哪些地方的弹性最重要,哪些不重要。这就是业务影响分析 (BIA) 变得至关重要的地方。它可以帮助您做出明智的决定,决定在哪里投资于韧性。BIA 可以帮助您了解系统的哪些部分真正需要坚如磐石的可靠性,哪些部分可以承受一定的灵活性。
首先绘制您的核心用户旅程。对于每一个人,请问自己以下几点:
-
如果中断会有什么影响?
-
我们必须以多快的速度恢复服务?
-
哪些数据对保护至关重要?
这不仅仅是一项技术练习;它可以帮助您了解可靠性问题对业务的影响。收入损失仅仅是个开始。考虑一下中断会如何削弱客户信任、违反监管要求或给竞争对手带来优势。
通过此分析,您将得出每个用户旅程的两个关键数字:恢复时间目标 (RTO) 和恢复点目标 (RPO)。RTO 定义了您必须以多快的速度恢复该旅程。RPO 定义了您的客户可以容忍多少数据丢失。然后,这些以业务为导向的目标将指导您选择哪些组件以及如何架构它们,而不会对系统的每个部分进行过度设计。
这种方法的美妙之处在于,它可以帮助您将有限的资源集中在最重要的地方。也许您的核心事务处理需要近乎即时的恢复和零数据丢失,但是您的推荐引擎可以容忍更长的停机时间。通过设定明确的目标,您可以创建一个框架,使您可以继续快速开发功能,同时从战略上增强弹性。
清楚地记录这些目标。它们不只是为你的工程团队准备的。当你向企业客户推销或与投资者进行技术尽职调查时,本文档表明你对业务连续性进行了批判性思考。
这些目标会随着创业公司的发展而变化。您的第一千名用户的弹性需求与您的第一个企业客户的弹性需求不同。从你今天可以实际实现的目标开始,但要计划好随着规模的扩大将如何收紧这些目标。
本指南探讨了如何实施满足这些目标的弹性措施。设定这些目标是您至关重要的第一步。它们是您应对创新与稳定之间持续紧张关系的指南针,可帮助您构建一个可靠地为客户提供价值的系统。