事件检测及响应服务入门
工作负载和警报是 AWS 事件检测及响应服务的核心。AWS 将与您密切合作,共同确定和监控对您的业务至关重要的特定工作负载。AWS 将协助您设置相关警报,快速将重大性能问题或客户影响通知给您的团队。正确配置警报对于在事件检测及响应服务中主动监控和快速响应事件而言至关重要。
工作负载
您可以选择要用于使用 AWS 事件检测及响应服务进行监控和关键事件管理的具体工作负载。工作负载是一系列资源和代码,它们协同工作,共同致力于提供业务价值。工作负载可能是构成银行支付门户或客户关系管理(CRM)系统的所有资源和代码。您可以通过单个 AWS 账户或多个 AWS 账户来托管工作负载。
例如,您可以在单个账户中托管一个单体应用程序(例如,下图中的员工绩效应用程序)。或者,您也可以将一个应用程序(例如图中的 Storefront Webapp)细分成微服务托管在不同的账户中。工作负载可能会与其它应用程序或工作负载共享数据库等资源,如下图所示。
要了解如何开始加入工作负载,请参阅工作负载加入和工作负载加入问卷。
警报
警报是事件检测及响应服务的关键部分,因为它们可以让您了解应用程序和底层 AWS 基础设施的性能。AWS 将与您协作,共同确定适当的指标和警报阈值,只有当您受监控的工作负载受到严重影响时才会触发这些指标和警报阈值。目标是让警报引起您指定的事件解决人员的注意,然后他们将会与事件管理团队协作,来快速为您解决所有问题。应将警报配置为仅在性能或客户体验显著降级而需要立即关注时才进入“警报”状态。一些主要警报类型包括指示业务影响的警报、Amazon CloudWatch 金丝雀警报和监控依赖关系的聚合警报等。
注意
要更改您的运行手册、工作负载信息或 AWS 事件检测及响应服务中监控的警报,请参阅请求更改已加入事件检测及响应服务的工作负载。