翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
[アラート]
アラートは、IT インフラストラクチャと IT サービスを運用する上で、セキュリティ、可用性、パフォーマンス、信頼性に関する最も重要な情報源の 1 つです。IT チームでは、アラートの通知によって、進行中のセキュリティの脅威、停止、パフォーマンスの問題、システム障害などの情報を得ています。
Information Technology Infrastructure Library (ITIL) のうち、とりわけ IT サービス管理 (ITSM) のプラクティスでは、モニタリング、イベント管理、インシデント管理のベストプラクティスで注視すべき点に自動アラートを設定します。
インシデントアラートとは、モニタリングツールでアラートを生成し、IT 環境の変更、高リスクのアクション、障害などの情報をチームと自動ツール (自動実行可能な項目の場合) に通知します。IT アラートは、重大なインシデントにつながりかねないシステム停止や変更を防御するための最前線として機能します。システムを自動的にモニタリングし、停止やリスクのある変更に関するアラートを生成することで、ダウンタイムを最小限に抑え、それに伴う高コストを削減できます。
Well-Architected AWS フレームワークでは、ベストプラクティスとして、モニタリングを使用してアラームベースの通知を生成し、プロアクティブにモニタリングおよびアラームを行うことを規定しています。CloudWatch やサードパーティー製のモニタリングサービスを利用して、メトリクスが想定範囲外となった旨が通知されるアラームを設定すると良いでしょう。
アラート管理の目的は、ログ記録、分類、アクション定義と実装、クローズ、インシデント後のレビューアクティビティなどにより、IT 関連のイベントとインシデントを処理する効率的で標準化された手順を確立することです。
セクション