

# OPS08-BP04 실행 가능한 알림 생성
<a name="ops_workload_observability_create_alerts"></a>

 애플리케이션 동작의 편차를 즉시 감지하고 이에 대응하는 것이 중요합니다. 특히 중요한 것은 핵심 성과 지표(KPI)를 기반으로 한 결과가 위험에 처하거나 예상치 못한 이상 현상이 발생할 때를 인식하는 것입니다. KPI에 기반한 알림을 통해 수신되는 신호가 비즈니스 또는 운영상의 영향과 직접 연계되도록 할 수 있습니다. 실행 가능한 경고에 대한 이러한 접근 방식은 사전 대응을 촉진하고 시스템 성능 및 안정성을 유지하는 데 도움이 됩니다. 

 **원하는 결과:** 특히 KPI 결과가 위험할 때 잠재적 문제를 신속하게 식별하고 완화할 수 있도록 시기적절하고 실행 가능한 알림을 받을 수 있습니다. 

 **일반적인 안티 패턴:** 
+  중요하지 않은 경고를 너무 많이 설정하면 경고로 인한 피로가 발생합니다. 
+  KPI에 따라 알림의 우선 순위를 정하지 않아 문제가 비즈니스에 미치는 영향을 파악하기 어렵습니다. 
+  근본 원인 해결을 소홀히 하여 동일한 문제에 대해 반복적인 경고가 발생합니다. 

 **이 모범 사례 확립의 이점:** 
+  실행 가능하고 관련성이 높은 경고에 집중하여 경고 피로를 줄였습니다. 
+  사전 예방적 문제 감지 및 완화를 통해 시스템 가동 시간 및 안정성을 개선했습니다. 
+  널리 사용되는 경고 및 커뮤니케이션 도구와 통합하여 팀 협업을 강화하고 문제를 더 빠르게 해결합니다. 

 **이 모범 사례가 확립되지 않을 경우 노출되는 위험 수준:** 높음 

## 구현 가이드
<a name="implementation-guidance"></a>

 효과적인 알림 메커니즘을 만들려면 KPI를 기반으로 한 결과가 위험에 처하거나 이상 징후가 감지될 때 플래그를 표시하는 지표, 로그 및 추적 데이터를 사용하는 것이 중요합니다. 

### 구현 단계
<a name="implementation-steps"></a>

1.  **핵심 성능 지표(KPI)를 정의합니다.** 애플리케이션의 KPI를 확인합니다. 알림을 이러한 KPI와 연계하여 비즈니스에 미치는 영향을 정확하게 반영해야 합니다. 

1.  **이상 탐지 구현:** 
   +  **AWS Cost Anomaly Detection 사용:** 비정상적인 패턴을 자동으로 감지하도록 [AWS Cost Anomaly Detection를](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 설정하여 실제 이상 징후에 대해서만 알림이 생성되도록 합니다. 
   +  **X-Ray 인사이트 사용:** 

     1.  추적 데이터에서 이상 징후를 감지하도록 [X-Ray Insights를](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) 설정하세요. 

     1.  감지된 문제에 대해 알림을 받도록 [X-Ray Insights에](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) 대한 알림을 구성합니다. 
   +  **DevOps Guru와 통합:** 

     1.  기존 데이터로 운영 이상 징후를 감지하는 머신 러닝 기능의 [Amazon DevOps Guru를](https://aws.amazon.com/devops-guru/) 활용하세요. 

     1.  다음 [알림 설정인](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings) DevOps Guru로 이동하여 이상 징후 알림을 설정합니다. 

1.  **실행 가능한 알림 구현:** 즉각적인 조치를 위한 적절한 정보를 제공하는 알림을 설계하세요. 

1.  **알람 피로 감소:** 중요하지 않은 알림을 최소화합니다. 대수롭지 않은 알림으로 팀에 부담을 주면 중요한 문제를 감독하고 알림 메커니즘의 전반적인 효율성을 떨어뜨릴 수 있습니다. 

1.  **복합 알람 설정:** 또한 [Amazon CloudWatch 복합 알람을](https://aws.amazon.com/blogs/mt/improve-monitoring-efficiency-using-amazon-cloudwatch-composite-alarms-2/) 사용하여 여러 알람을 통합할 수 있습니다. 

1.  **경고 도구와 통합:** 다음과 같은 도구 통합 [Ops Genie](https://www.atlassian.com/software/opsgenie) 및 [PagerDuty](https://www.pagerduty.com/). 

1.  **참여 Amazon Q Developer in chat applications** Amazon Q Developer in chat applications과 [통합하여](https://aws.amazon.com/chatbot/)Chime, Microsoft Teams, Slack에 알림을 전달합니다. 

1.  **로그 기반 경고:** 또한 [로그 지표 필터를](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) CloudWatch에서 사용하여 특정 로그 이벤트를 기반으로 경보를 생성합니다. 

1.  **검토 및 반복:** 경고 구성을 정기적으로 재검토하고 수정하세요. 

 **구현 계획의 작업 수준:** 보통. 

## 리소스
<a name="resources"></a>

 **관련 모범 사례:** 
+  [OPS04-BP01 핵심 성과 지표 파악](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 애플리케이션 원격 측정 구현](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 사용자 경험 원격 측정 구현](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 종속성 원격 측정 구현](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 분산 추적 구현](ops_observability_dist_trace.md) 
+  [OPS08-BP01 워크로드 지표 분석](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 워크로드 로그 분석](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 워크로드 추적 데이터 분석](ops_workload_observability_analyze_workload_traces.md) 

 **관련 문서:** 
+ [ Amazon CloudWatch 경보 사용 ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)
+ [ 복합 알람 생성 ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html)
+ [ 이상 탐지에 기반한 CloudWatch 경보 생성 ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html)
+ [ DevOps Guru 알림 ](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html)
+ [ X-Ray Insights 알림 ](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications)
+ [ o상호작용형 ChatOps로 AWS 리소스 모니터링, 운영 및 문제 해결 ](https://aws.amazon.com/chatbot/)
+ [ Amazon CloudWatch 통합 가이드 \$1 PagerDuty ](https://support.pagerduty.com/docs/amazon-cloudwatch-integration-guide)
+ [ OpsGenie와 Amazon CloudWatch 통합 ](https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-amazon-cloudwatch/)

 **관련 동영상:** 
+ [ Create Composite Alarms in Amazon CloudWatch ](https://www.youtube.com/watch?v=0LMQ-Mu-ZCY)
+ [ Amazon Q Developer in chat applications 개요 ](https://www.youtube.com/watch?v=0jUSEfHbTYk)
+ [AWS On Air ft. Mutative Commands in Amazon Q Developer in chat applications ](https://www.youtube.com/watch?v=u2pkw2vxrtk)

 **관련 예시:** 
+ [ Amazon CloudWatch을 통해 클라우드에서의 경보, 사고 관리 및 문제 해결 ](https://aws.amazon.com/blogs/mt/alarms-incident-management-and-remediation-in-the-cloud-with-amazon-cloudwatch/)
+ [ 자습서: Amazon Q Developer in chat applications에 알림을 보내는 Amazon EventBridge 규칙 만들기 ](https://docs.aws.amazon.com/chatbot/latest/adminguide/create-eventbridge-rule.html)
+ [ One Observability Workshop ](https://catalog.workshops.aws/observability/en-US/intro)