本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
警报
就您的 IT 基础设施和 IT 服务的安全性、可用性、性能和可靠性而言,提醒是最重要的信息来源之一。它们会通知 IT 团队有关持续存在的安全威胁、服务中断、性能问题或系统故障等情况。
信息技术基础设施库(ITIL),特别是 IT 服务管理(ITSM)实践,可将自动提醒设置为监控和活动管理及事件管理最佳实践的焦点。
事件提醒是指监控工具生成提醒,以通知您的团队和自动化工具(对于可自动操作的项目)有关 IT 环境中的更改、高风险操作或故障。IT 提醒是防止系统中断或更改演变成重大事件的第一道防线。通过自动监控系统并生成中断和风险更改提醒,IT 团队可以最大限度地减少停机时间并降低随之而来的高昂成本。
作为最佳实践,Well-Architected Framework 规定您可以使用监控来生成基于警报的通知,并主动进行监控和警报。 AWS使用 CloudWatch 或第三方监控服务设置警报,以指示指标何时超出预期界限。
提醒管理的目的是建立高效、标准化的程序,通过日志记录、分类、操作定义和实施、关闭和事后审查活动来处理与 IT 相关的活动和事件。
Sections