与 SaaS 产品网络接入相关的卓越运营指标 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

与 SaaS 产品网络接入相关的卓越运营指标

运营弹性和灾难恢复

网络接入方法应有助于SaaS产品抵御各种类型的中断,并从任何灾难中快速恢复。

高分标准

既定和测试的灾难恢复计划始终表明,网络接入方法符合灾难恢复要求。网络访问方法支持高可用性配置,并支持自动、快速和可靠的故障转移机制。

低分指标

网络接入方法使得制定连贯的灾难恢复策略变得困难。您观察到中断后的恢复时间会延长。网络基础设施的频繁运行故障正在影响服务交付。

自我评估问题

  • 上一次灾难恢复演习是什么时候,结果如何?

  • 中断后恢复关键服务需要多长时间? 需要重新部署网络基础设施的哪一部分?

  • 为了简化您的灾难恢复计划,可以对网络基础设施进行哪些改进?

  • 最关键的网络组件是否有冗余?

  • 在严重中断之后,您是否已经自动完成了可能的网络基础设施重新部署?

  • 网络接入方法如何支持容错和可靠性? 是否有内置机制来处理网络中断和维护数据完整性?

服务和应用程序性能监控

网络访问方法可能会影响用于验证最佳操作和服务正常运行时间的性能监控工具。根据服务的不同,您可以访问低级指标(例如丢包率)或更高级别的指标(例如会话持续时间)。低级指标可以提供有关网络行为的详细技术见解,但解释起来可能很复杂。相比之下,更高级别的指标通常提供了一种更直接、更简单的方法来衡量整体用户体验。这是因为它们将底层网络状况的影响汇总为明确的服务质量指标。

高分标准

提供近乎实时的见解的全面监控工具随时可用。您拥有解决性能问题的自动警报和响应系统。您可以预测潜在的服务瓶颈或故障,以免它们影响用户。

低分指标

频繁的服务中断或性能问题在没有被观察或采取措施的情况下发生。缺乏对服务性能的可见性会导致对性能瓶颈的反应缓慢。需要多方团队来解决网络基础设施问题。

自我评估问题

  • 目前有哪些监控工具和网络基础设施指标可用? 它们在检测服务异常方面的效果如何?

  • 您能以多快的速度识别和解决性能问题?

  • 您是否有预测潜在性能问题的机制?

  • 您可以做出哪些改进来增强可观测性能力?