階段 3：檢查、調整和重複

實作可觀測性系統之後，建議您持續檢閱、評估、學習、調整和改善實作。您可以使用AWS 可觀測性成熟度模型作為工具，以評估實作的成熟度，並識別需要改進的領域並排定其優先順序。

實作定期檢閱

可觀測性是一種反覆程序。它需要定期稽核和評估現有元件，以及變更和增強功能，以推動持續改進。我們建議您執行定期審查，以重新評估 SLOs、警示閾值、儀表板、指標精細程度、保留政策、抽樣策略等，以確保這些都為您的團隊和業務帶來價值。透過將可觀測性成本連接到特定團隊和服務，您可以啟用有關涵蓋範圍和資源配置的資料驅動型決策。

在 Amazon，我們會每週執行營運準備度審查 (ORRs)，根據最佳實務稽核團隊的程序和可觀測性狀態。這是非封鎖練習，符合 Amazon 的服務數量和發行頻率。

根據您的組織大小，您也可以擁有照常營運 (BAU) 名單，其中每個團隊中的一位成員負責報告異常和趨勢、發現未知情況、移除不必要的檢測和提醒、改善儀表板，並確保可觀測性解決方案繼續為團隊工作，並與團隊的目標和成功指標保持一致。這也有機會重新評估警示策略，以更迅速、主動且更接近使用者。這些檢閱的目標是建立良性循環，如下圖所示，並改善可觀測性姿勢成熟度的成熟度，如AWS 可觀測性成熟度模型中所述。

識別最常存取的手冊，並考慮改善您的應用程式或新增更多檢測。識別最常執行的 Runbook，並考慮自動化這些 Runbook。

這些檢閱的學習也會與可觀測性小組和專家分享，以強調集中計劃和可觀測性平台的改善。例如，根據部署觸發事件的頻率，您可以決定優先改善部署管道，而不是其他元件。如果 MTTR 因為監控差距而較高，您可以優先改善可觀測性平台及其組態。

慶祝勝利

分享來自使用可觀測性工具之團隊的成功案例。例如，強調使用可觀測性指標來實作替代解決方案的團隊成功，該解決方案更有效率，並降低延遲或成本。傳達此成功強調可觀測性的重要性，並鼓勵其他團隊改善可觀測性狀態，並努力取得類似的成功。

從事件中學習

進行與 Amazon 錯誤校正 (COE) 程序類似的無責事後練習，以識別需要改進的領域並防止未來發生問題。與獲勝一樣，本練習的學習可以與其他團隊廣泛分享，以強化可觀測性和最佳實務的價值。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

階段 2：實作可觀測性

後續步驟和資源