設計原則
下列設計原則有助於實現雲端中的卓越營運:
-
以程式碼執行營運:在雲端,您可以在整個環境中套用與您應用程式程式碼所用的相同工程原則。您可將整個工作負載 (應用程式、基礎設施等) 定義為程式碼,並以程式碼加以更新。您可以使用指令碼處理營運程序,並透過啟動這些指令碼來自動化其程序,進而回應事件。透過以程式碼執行營運,您可限制人為錯誤並建立對事件的一致回應。
-
進行頻繁、細微和可逆的變更:設計可擴展且鬆散耦合的工作負載以允許定期更新元件。自動化部署技術加上較細微的增量變更可縮減影響範圍,並在發生故障時更快地反轉情況。這可讓您更有信心您能為工作負載帶來有益的變更,同時維持品質並迅速適應市場情況的變化。
-
經常完善營運程序:隨著您工作負載的演進,您的營運也應該適當演進。在使用營運程序時,尋找機會予以改善。保持定期檢閱,並驗證所有程序是否有效以及團隊是否熟悉這些程序。如果發現漏洞,請相應地更新程序。向所有利害關係人和團隊傳達程序更新消息。將營運遊戲化以分享最佳實務並教導團隊。
-
預期失敗:執行「事前剖析」演練,以識別潛在的失敗來源,進而排除或減少這些來源。測試您的失敗情境,並驗證您理解失敗情境會造成的影響。測試您的回應程序,以確保它們確實有效且團隊熟悉其流程。設定定期演練日,以測試工作負載和團隊對模擬事件的回應。
-
從所有營運失敗中學習經驗:從所有營運事件和失敗中學習經驗,進而不斷推動改善。跨團隊及在整個組織中分享獲得的經驗。
-
使用受管服務:盡可能地使用 AWS 受管服務以降低營運負擔。圍繞與這些服務的互動建置營運程序。
-
實作可觀測性以獲得可採取行動的見解:全面了解工作負載的行為、效能、可靠性、成本和運作狀態。建立關鍵績效指標 (KPI) 並利用可觀測性遙測,以做出明智決策並在業務成果面臨風險時立即採取行動。根據可採取行動的可觀測性資料,主動改善效能、可靠性和成本。