AIOps
当您将工作负载迁移至 AWS 时,可以利用各种增强了人工智能和机器学习(ML)功能的 AWS 监控服务。尽管通过 Amazon CloudWatch Events、警报和 AWS Config 规则进行的传统监控能够提供基础洞察,但集成机器学习技术可将运营智能提升到新的水平。
Amazon CloudWatch 调查代表了人工智能和 IT 运营的融合,旨在最大限度减少人工干预运营流程的情况。Amazon DevOps Guru 提供主动事件检测和建议,可帮助预防潜在问题,避免其影响您的系统。Amazon CloudWatch 异常检测使用机器学习算法来分析历史指标模式,以检测 AWS 资源中的异常行为。
人工智能运营(AIOps)服务通过三个关键维度增强运营能力:服务质量改进、主动运营、增强运营洞察力。
服务质量改进
-
高级指标关联与模式分析
-
自动警示和通知系统实施
-
与事件管理系统无缝集成
主动运营
-
基于机器学习的异常检测
-
持续的绩效指标跟踪与趋势分析
-
实时监控与警示
增强运营洞察力
-
资源性能分析
-
应用程序行为跟踪
-
自动问题检测与分类
通过在 AWS 上实施 AIOp,组织可以实现更高效的运营,缩短解决问题平均耗费的时间(MTTR),并通过数据驱动、人工智能增强的运营实践,提高整体服务可靠性。这种现代化方法有助于组织从被动应对转向主动式运营管理,同时充分利用 AWS 提供的强大人工智能/机器学习功能。