使用指标、审计日志和警报进行监控 AWS CloudHSM - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用指标、审计日志和警报进行监控 AWS CloudHSM

Shubhansu Sawaria,Amazon Web Services ()AWS

2025 年 2 月文档历史记录

本指南概述了用于管理AWS CloudHSM集群的可观测性和监控工具以及最佳实践。要监控集 AWS CloudHSM 群,您需要测量、跟踪和评估其可用性、性能、安全性和功能。

在上 AWS,您可以分析工作负载日志、指标、事件和跟踪,以了解工作负载运行状况。这可以帮助您随着时间的推移获得运营见解。监控有助于确保资源按预期运行,以便您可以检测并主动解决问题。使用监控的指标、日志和事件在超过阈值时设置警报。

目标受众

本指南适用于设计、实施或管理 AWS CloudHSM 工作负载监控和可观测性解决方案的解决方案架构师、高级 DevOps 工程师和团队成员。

目标业务成果

通过实施监控和警报最佳实践,您可以帮助您的应用程序和工作负载实现高性能、弹性、高效、安全且成本优化的基础架构。这些最佳实践可以近乎实时地观察和分析 AWS CloudHSM 集群的整体运行状况和性能。

监控和警报可帮助您防止相关的 IT 服务降级或中断。如果出现计划外降级或服务中断,监控和警报工具可以帮助及时进行检测、上报、反应、调查和解决。

强大的监控和警报解决方案有助于实现以下关键业务成果:

  • 增强客户体验

  • 建立客户信任

  • 减轻与计划外服务中断相关的财务损失

  • 通过帮助开发人员更快地发现和解决问题来提高他们的工作效率

  • 通过提高可用性来提高运营效率和效益