インシデントレポートの用語 - Amazon CloudWatch

インシデントレポートの用語

CloudWatch 調査インシデントレポートでは、次の用語が使用されます。

AI が導出した事実

AWS サービス内の利用可能なデータ、テレメトリ、ログ、履歴パターンに基づいて、AI システムが客観的に真または可能性が高いと見なす個々の情報または観測。これらの事実はアルゴリズム分析と機械学習モデルによって導き出され、システムによって信頼できるものとして扱われますが、特に重要な意思決定コンテキストでは、人間による検証を受ける必要があります。AI が導出した事実には、人間のオペレーターにとってすぐには明らかではないシステム動作に関するイベント間の相関関係、異常検出、または推論が含まれる場合があります。

是正措置

AWS ベストプラクティスと影響を受けるリソースの特定のコンテキストに基づいて、インシデントの根本原因に対処し、再発を防ぐために CloudWatch 調査で推奨される具体的で実用的な手順。

事実のカテゴリ

レポート生成のためにデータを整理するために使用される、影響メトリクス、検出の詳細、緩和手順などのインシデント関連情報の構造化されたグループ化。

影響の評価

調査に追加された CloudWatch メトリクスやその他の AWS サービスのデータから導出された、システムパフォーマンス、ユーザーエクスペリエンス、ビジネスオペレーションに対するインシデントの影響の定量的および定性的評価。

インシデントレポートの生成

CloudWatch 調査の調査中に収集されたデータに基づいて、タイムライン、影響、根本原因、解決手順など、運用インシデントの包括的なドキュメントを作成する自動化されたプロセス。

調査フィード

CloudWatch 調査の調査内で受け入れられた観測値、仮説、およびユーザー追加メモの時系列表示。調査の進行状況と検出結果のプライマリレコードとして機能します。

教訓

組織全体のシステムの信頼性、運用効率、インシデント対応能力の向上を目的として、インシデント調査プロセスを通じて特定されたインサイトと改善の機会。自動的に生成されます。

レポート評価

生成されたインシデントレポートの自動評価。レポートの完全性と品質を向上させるために、データ欠落の可能性や追加情報が必要な領域を特定します。

根本原因分析

CloudWatch 調査の AI 主導の仮説と複数の AWS サービス間の相関を活用して、運用上の問題の基本的な理由を特定する体系的なプロセス。

提案タブ

システムテレメトリとログの分析に基づいて、潜在的な原因や関連する問題に関する AI 生成の観測と仮説を表示する CloudWatch 調査の機能。

タイムラインイベント

インシデント発生中の重要な事象の時系列シーケンス。CloudWatch ログ、メトリクス、その他の AWS サービスのデータから自動的に抽出され、インシデント進行状況の概要を明確にします。