PERF07-BP04 借助监控来生成基于警报的通知
根据您定义的与性能相关的关键性能指标 (KPI),使用当测量值超出预期范围时能够自动生成警报的监控系统。
Amazon CloudWatch 可以收集架构中各种资源的指标。您也可以收集和发布自定义指标,用于显示业务指标或派生指标。使用 CloudWatch 或第三方监控服务设置表明超出阈值的警报;警报表明某个指标超出预期范围。
常见反模式:
-
您可以依靠工作人员来观察指标,并在他们发现问题时做出响应。
-
您仅依赖于运维手册,但可以触发无服务器工作流来完成相同的任务。
建立此最佳实践的好处: 您可以根据预定义的阈值,或根据可识别您的指标中的异常行为的机器学习算法,设置警报并自动执行操作。这些警报还可以触发无服务器工作流,从而修改工作负载的性能特性(例如,增加计算容量、更改数据库配置)。
未建立这种最佳实践的情况下暴露的风险等级: 中
实施指导
监控指标:Amazon CloudWatch 可以收集架构中各种资源的指标。您可以收集和发布自定义指标,用于显示业务指标或派生指标。可以使用 CloudWatch 或第三方监控服务来设置指示超出阈值的警报。
资源
相关文档:
相关视频:
相关示例: