COST11-BP01 執行操作自動化
評估雲端上的營運成本,著重於量化管理任務、部署中節省的時間和精力,並透過自動化降低人為錯誤、法規遵循和其他操作的風險。評估營運工作所需的時間和相關成本,並實作管理任務的自動化,以盡可能地減少手動工作量。
未建立此最佳實務時的曝險等級:低
實作指引
將操作自動化可減少人工作業的頻率、提升效率,且客戶可在部署、管理或操作工作負載時享有一致而穩定的體驗。您可以將基礎設施資源從手動操作任務中解放出來,並將其用於價值更高的任務與創新,這可提升商業價值。企業需要以經過實證和測試的方式來管理其雲端中的工作負載。該解決方案必須安全、快速且具有成本效益,並具有最低的風險和最大的可靠性。
首先,考慮整體營運成本,根據所需的工作量確定操作活動的優先順序。例如,在雲端中部署新資源、對現有資源進行優化變更,或實作所需的組態,分別需要多久的時間? 透過考慮運營和管理成本來確定人為行動的總成本。排定管理任務的自動化優先順序,以減少人力。
審查工作量應反映潛在的效益。例如,檢查手動執行任務所花費的時間 (對照自動執行)。優先考慮自動化重複、高價值、耗時且複雜的活動。具有高價值或高人為錯誤風險的活動通常是開始自動化的起點,因為這類風險通常會產生不必要的額外營運成本 (例如營運團隊的加班費)。
使用 AWS Systems Manager 或 AWS Config 等自動化工具,簡化操作、合規、監控、生命週期和終止流程。使用 AWS 服務、工具或第三方產品時,可以自訂您實作的自動化,以滿足特定需求。下表顯示您可以透過 AWS 服務取得哪些核心操作功能與能力,以自動執行管理與操作:
-
AWS Audit Manager
:持續稽核 AWS 使用情況,以簡化風險與合規性評估 -
AWS Backup
:集中管理和自動化資料保護。 -
AWS Config:
配置計算資源,評定、審核、評估組態和資源清單。 -
AWS CloudFormation
:使用基礎設施即程式碼啟動高可用性資源。 -
AWS CloudTrail
:IT 變更管理、合規性和控制。 -
Amazon EventBridge
會排程事件並觸發 AWS Lambda 以採取行動。 -
AWS Lambda
:透過事件觸發重複性流程,或使用 AWS EventBridge 按固定排程執行它們,從而進行自動化。 -
AWS Systems Manager
:啟動和停止工作負載、修補作業系統、自動化組態,以及持續管理。 -
AWS Step Functions
:排程工作並自動化工作流程。 -
AWS Service Catalog
:範本使用,具有合規性和控制的基礎設施即程式碼。
如果您希望藉由使用 AWS 產品和服務立即採用自動化,但您的組織沒有這類技能,請聯絡 AWS Managed Services (AMS)
AWS Managed Services (AMS) 是代表企業客戶和合作夥伴營運 AWS 基礎設施的服務。它提供安全且合規的環境,您可以將工作負載部署至其中。AMS 使用企業雲端營運模型與自動化,讓您符合組織需求、更快速地遷移至雲端,以及降低持續管理成本。
AWS Professional Services 也可以幫助您實現所需的業務成果並使用 AWS 來自動化操作。它們可協助客戶部署已針對雲端進行優化的自動化、穩健而靈活的 IT 營運及管控能力。如需詳細的監控範例和建議的最佳實務,請參閱《卓越營運支柱》白皮書。
實作步驟
-
建置一次並多次部署:使用 CloudFormation、AWS SDK 或 AWS CLI 等基礎設施即程式碼,進行一次部署,然後多次用於類似的環境或災難復原案例。在部署時加上標籤以追蹤您的使用量,如其他最佳實務所定義。使用 AWS Launch Wizard
可減少部署許多熱門企業工作負載的時間。AWS Launch Wizard 會遵循 AWS 最佳實務,引導您完成企業工作負載的調整、設定和部署。也可以使用 Service Catalog ,協助您建立和管理基礎設施即程式碼核准的範本,以便在 AWS 上使用,這樣任何人都能發現經核准的自助式雲端資源。 -
自動化持續合規性:考慮根據預先定義的標準,自動化記錄的組態的評估和修復。當您將 AWS Organizations 與 AWS Config 和 AWS CloudFormation
的功能結合使用時,可以有效管理和自動化數百個成員帳戶的大規模組態合規性。您可審核 AWS 資源之間組態和關係的變更,並深入了解資源組態的歷史。 -
自動化監控任務 AWS 提供各種可用來監控服務的工具。您可以設定這些工具來自動執行監控工作。建立和實作監控計畫來收集工作負載的全面監控資料,以便在出現多點故障時能更輕鬆地偵錯。例如,您可以使用自動化監控工具來監控 Amazon EC2,並在系統狀態檢查、執行個體狀態檢查和 Amazon CloudWatch 警示發生錯誤時向您回報。
-
自動化維護和操作:自動執行例行操作,無須人為介入。使用 AWS 服務和工具,可以選擇實作哪些 AWS 自動化,並根據您的特定需求進行定制。例如,使用 EC2 Image Builder
建置、測試和部署虛擬機器和容器映像,以便在 AWS 或內部部署中使用,或使用 AWS SSM 修補 EC2 執行個體。如果無法使用 AWS 服務完成所需操作,或者您需要透過篩選資源進行更複雜的操作,請使用 AWS Command Line Interface (AWS CLI) 或 AWS SDK 工具來自動化操作。AWS CLI 可使用指令碼來自動化控制和管理 AWS 服務的整個流程,而無須使用 AWS 管理主控台。選取您慣用的 AWS SDK 與 AWS 服務互動。如需其他程式碼範例,請參閱 AWS SDK 程式碼範例儲存庫 。 -
使用自動化建立持續的生命週期:建立並保留成熟的生命週期政策非常重要,這不僅適用於法規或備援,還適用於成本最佳化。可使用 AWS Backup 集中管理和自動化資料存放區 (例如儲存貯體、磁碟區、資料庫和檔案系統) 的資料保護。也可以使用 Amazon Data Lifecycle Manager 來自動建立、保留和刪除 EBS 快照和 EBS 後端 AMI。
-
刪除不必要的資源:在沙箱或開發 AWS 帳戶中累積未使用的資源很常見。開發人員會在正常開發週期中建立並試驗各種服務和資源,然後在不再需要這些資源時不會刪除它們。未使用的資源可能會為組織帶來不必要的、有時甚至很高的成本。刪除這些資源可以降低操作這些環境的成本。如果不確定,請確保不再需要資料或已備份。可以使用 AWS CloudFormation 來清理已部署的堆疊,這會自動刪除範本中定義的大部分資源。或者,可以使用 aws-nuke 之類的工具,建立自動化功能,以刪除 AWS 資源。
資源
相關文件:
相關影片:
相關範例: