產生事件報告 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

產生事件報告

事件報告可協助您更快速且輕鬆地撰寫有關事件調查的報告。您可以使用此報告向管理層提供詳細資訊,或協助您的團隊從事件中學習,並採取動作來防止未來發生這種情況。報告的結構是以這些報告類型的產業標準為基礎,並且可以複製到其他儲存庫以進行長期保留。

當您使用 AWS 管理主控台在 CloudWatch 調查中建立調查群組資源時,會為群組建立 IAM 角色,以在調查期間授予資源存取權。產生 CloudWatch 調查事件報告需要將其他許可授予您的調查群組。新的 受管政策AIOpsAssistantIncidentReportPolicy提供必要的許可,並自動新增至 2025 年 10 月 10 日AWS 管理主控台之後使用 建立的調查群組。如需詳細資訊,請參閱AIOpsAssistantIncidentReportPolicy

注意

如果您使用的是 CDK 或 SDK,則必須明確新增調查群組角色,並指定角色政策或該角色的同等內嵌許可。如需許可的詳細資訊,請參閱 CloudWatch 調查功能的安全性

這些報告會以結構化格式擷取調查結果、根本原因、時間軸事件和建議的修正動作,可輕鬆與利益相關者共用並用於組織學習。

所有 CloudWatch 調查使用者都會免費加入事件報告產生,並與您的調查工作流程無縫整合。

事件報告的運作方式

  1. 對您的事件執行調查。

  2. 接受至少一個假設。報告會考慮您接受的每個假設。假設不需要 100% 準確。

  3. 選擇事件報告。在調查期間,AI 會剖析為調查收集的資料和衍生的事實。事實是關於您事件的原子資訊片段,構成產生報告的基礎。事實擷取可能需要幾分鐘的時間。

  4. 當事實擷取完成時,您可以檢閱下列領域中可用的事實:

    1. 事件概觀 – 事件的高階概觀,包括其嚴重性、持續時間和操作假設。

    2. 影響評估 – 與事件對客戶、服務職能和業務營運的影響相關的指標和分析。

    3. 偵測和回應 – 與如何和何時偵測到事件以及您回應事件的方式相關的指標和分析。

    4. 根本原因分析 – 根據調查假設對根本原因進行詳細分析。

    5. 緩解和解決 – 與緩解步驟和解決措施相關的指標和分析,以及事件緩解和解決的時間測量。

    6. 學習和後續步驟 – 團隊要考慮的建議動作清單,會自動從調查結果產生。這些建議可能包括針對類似事件的預防措施,以及監控和回應程序的建議改進。

  5. 檢閱事實後,選擇產生報告以建立事件的完整分析。雖然選取的事實做為關鍵參考點,但報告會從調查期間收集的所有可用資訊中提取。此程序需要幾分鐘的時間。

  6. 產生報告之後,您可以:

    • 依原樣使用報告:

      • 視需要將其複製以在外部編輯器中編輯

      • 儲存它以供日後參考

    • 透過新增更多資料來增強報告:

      • 選擇新增事實 (建議的方法) 以輸入其他文字型內容,例如事件票證或自訂敘述。AI 會分析此內容,以增強現有的事實或推斷新的事實。

      • 直接編輯事實 (謹慎使用) - 手動編輯的事實可能會與調查時間表產生不一致。只有在新增事實未達到預期結果時,這才應該用作最後手段。

    • 選擇重新產生報告,以使用更新的資訊產生新的報告。