本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用指标、审计日志和警报进行监控 AWS CloudHSM
Shubhansu Sawaria,Amazon Web Services ()AWS
2025 年 2 月(文档历史记录)
本指南概述了用于管理AWS CloudHSM集群的可观测性和监控工具以及最佳实践。要监控集 AWS CloudHSM 群,您需要测量、跟踪和评估其可用性、性能、安全性和功能。
在上 AWS,您可以分析工作负载日志、指标、事件和跟踪,以了解工作负载运行状况。这可以帮助您随着时间的推移获得运营见解。监控有助于确保资源按预期运行,以便您可以检测并主动解决问题。使用监控的指标、日志和事件在超过阈值时设置警报。
目标受众
本指南适用于设计、实施或管理 AWS CloudHSM 工作负载监控和可观测性解决方案的解决方案架构师、高级 DevOps 工程师和团队成员。
目标业务成果
通过实施监控和警报最佳实践,您可以帮助您的应用程序和工作负载实现高性能、弹性、高效、安全且成本优化的基础架构。这些最佳实践可以近乎实时地观察和分析 AWS CloudHSM 集群的整体运行状况和性能。
监控和警报可帮助您防止相关的 IT 服务降级或中断。如果出现计划外降级或服务中断,监控和警报工具可以帮助及时进行检测、上报、反应、调查和解决。
强大的监控和警报解决方案有助于实现以下关键业务成果:
-
增强客户体验
-
建立客户信任
-
减轻与计划外服务中断相关的财务损失
-
通过帮助开发人员更快地发现和解决问题来提高他们的工作效率
-
通过提高可用性来提高运营效率和效益