

# OPS08-BP04 実践的なアラートを作成する
<a name="ops_workload_observability_create_alerts"></a>

 アプリケーションの動作の逸脱を迅速に検出して対応することが重要です。特に重要なのは、主要業績評価指標 (KPI) に基づく成果がリスクにさらされている場合や、予期しない異常が発生した場合を認識することです。KPI に基づいてアラートを送信することで、受信される警告が直接的に業務や運用上の影響と関連付けられるようになります。実践的なアラートに関するこのようなアプローチを採用すると、積極的な対応の促進とシステムのパフォーマンスと信頼性の維持につながります。 

 **期待される成果:** 特に KPI の結果がリスクにさらされている場合に、潜在的な問題を迅速に特定して緩和するために、関連性が高く、実践的なアラートをタイムリーに受信できます。 

 **一般的なアンチパターン:** 
+  重大ではないアラートを多数設定しすぎて、アラート疲れを引き起こしている。 
+  アラートに KPI に基づく優先順位付けを行っていないため、問題が業務に及ぼす影響を把握できにくくなっている。 
+  根本原因への対処を怠っているため、同じ問題について繰り返しアラートが送信される。 

 **このベストプラクティスを活用するメリット:** 
+  実践的で関連性の高いアラートに重点を置くことで、アラート疲労を軽減します。 
+  問題を事前に検出して軽減することで、システムの稼働時間と信頼性が向上します。 
+  一般的なアラートツールやコミュニケーションツールと統合することで、チームのコラボレーションを強化し、問題を迅速に解決できます。 

 **このベストプラクティスを活用しない場合のリスクレベル:** 高 

## 実装のガイダンス
<a name="implementation-guidance"></a>

 効果的なアラートメカニズムを構築するには、KPI に基づく結果がリスクにさらされている場合や異常が検出された場合にフラグを立てるメトリクス、ログ、トレースデータを使用することが重要です。 

### 実装手順
<a name="implementation-steps"></a>

1.  **主要業績評価指標 (KPI) を定義します。** アプリケーションの KPI を特定します。正確に業務への影響を反映するには、アラートをこのような KPI に関連付ける必要があります。 

1.  **異常検出の実装:** 
   +  **AWS Cost Anomaly Detection の使用:** [AWS Cost Anomaly Detection を](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 異常なパターンを自動的に検出し、正当な異常に対してのみアラートが生成されるように設定します。 
   +  **X-Ray Insights の使用:** 

     1.  [X-Ray Insights を](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) トレースデータの異常を検出するように設定します。 

     1.  問題が検出された場合に [X-Ray Insights にアラートを送信する](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) ように通知を設定します。 
   +  **DevOps Guru との統合:** 

     1.  [Amazon DevOps Guru の](https://aws.amazon.com/devops-guru/) 機械学習機能を活用して、既存のデータの運用上の異常を検出します。 

     1.  [https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings) DevOps Guru の通知設定に移動して、異常アラートを設定します。 

1.  **実践的なアラートの実装:** すぐに行動に移せるように、適切な情報を提供するアラートを設計します。 

1.  **アラーム疲労の軽減:** 重大ではないアラートは最小限に抑えます。多数の重要でないアラートによりチームに負担がかかると、重大な問題の見落としにつながり、アラートメカニズムの全体的な有効性が低下する場合があります。 

1.  **複合アラームの設定:** [Amazon CloudWatch の複合アラームを使用して、](https://aws.amazon.com/blogs/mt/improve-monitoring-efficiency-using-amazon-cloudwatch-composite-alarms-2/) 複数のアラームを統合します。 

1.  **アラートツールとの統合:** [Ops Genie](https://www.atlassian.com/software/opsgenie) や [PagerDuty](https://www.pagerduty.com/)などのツールと統合します。 

1.  **Amazon Q Developer in chat applications との連携:** [Amazon Q Developer in chat applications](https://aws.amazon.com/chatbot/)と統合して、Chime、Microsoft Teams、Slack にアラートを中継します。 

1.  **ログに基づくアラート:** [https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) CloudWatch ログのメトリクスフィルターを使用して、特定のログイベントに基づくアラームを作成します。 

1.  **レビューと反復:** アラート設定を定期的に見直して調整します。 

 **実装計画に必要な工数レベル:** 中程度 

## リソース
<a name="resources"></a>

 **関連するベストプラクティス:** 
+  [OPS04-BP01 主要業績評価指標を特定する](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 アプリケーションテレメトリーを実装する](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 ユーザーエクスペリエンステレメトリーを実装する](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 依存関係のテレメトリーを実装する](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 分散トレースを実装する](ops_observability_dist_trace.md) 
+  [OPS08-BP01 ワークロードメトリクスを分析する](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 ワークロードログを分析する](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 ワークロードのトレースを分析する](ops_workload_observability_analyze_workload_traces.md) 

 **関連するドキュメント:** 
+ [ Amazon CloudWatch でのアラームの使用 ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)
+ [ 複合アラームを作成する ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html)
+ [ 異常検出に基づいて CloudWatch アラームを作成する ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html)
+ [ DevOps Guru の通知 ](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html)
+ [ X-Ray Insights の通知 ](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications)
+ [ インタラクティブな ChatOps による AWS リソースのモニタリング、運用、トラブルシューティング ](https://aws.amazon.com/chatbot/)
+ [ Amazon CloudWatch 統合ガイド \$1 PagerDuty ](https://support.pagerduty.com/docs/amazon-cloudwatch-integration-guide)
+ [ OpsGenie を Amazon CloudWatch と統合する ](https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-amazon-cloudwatch/)

 **関連動画:** 
+ [ Amazon CloudWatch で複合アラームを作成する ](https://www.youtube.com/watch?v=0LMQ-Mu-ZCY)
+ [ Amazon Q Developer in chat applications の概要 ](https://www.youtube.com/watch?v=0jUSEfHbTYk)
+ [AWS on Air ft.Amazon Q Developer in chat applications の変異型コマンド ](https://www.youtube.com/watch?v=u2pkw2vxrtk)

 **関連する例:** 
+ [ Amazon CloudWatch を使用したクラウドでのアラーム、インシデント管理、修復 ](https://aws.amazon.com/blogs/mt/alarms-incident-management-and-remediation-in-the-cloud-with-amazon-cloudwatch/)
+ [ チュートリアル: Amazon Q Developer in chat applications に通知を送信する Amazon EventBridge ルールの作成 ](https://docs.aws.amazon.com/chatbot/latest/adminguide/create-eventbridge-rule.html)
+ [ One Observability ワークショップ ](https://catalog.workshops.aws/observability/en-US/intro)