

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# AWS Resilience Hub – 彈性管理
<a name="arh-mgmt"></a>

AWS Resilience Hub 可讓您集中定義、驗證和追蹤 AWS 應用程式的彈性。 AWS Resilience Hub 可協助您保護應用程式免於中斷，並降低復原成本，以最佳化業務持續性，協助符合合規和法規要求。您可以使用 AWS Resilience Hub 執行下列動作：
+ 分析您的基礎設施並取得建議，以改善應用程式的彈性。除了改善應用程式彈性的架構指引之外，建議還提供程式碼以符合您的彈性政策、實作測試、警示和標準操作程序 (SOPs)，您可以在整合和交付 (CI/CD) 管道中搭配應用程式部署和執行。
+ 在不同條件下評估復原時間目標 (RTO) 和復原點目標 (RPO)。
+ 最佳化業務持續性，同時降低復原成本。
+ 在生產中發生問題之前，先識別並解決問題。

將應用程式部署至生產環境後，您可以將 AWS Resilience Hub 新增至 CI/CD 管道，以驗證每個建置，再將其發佈至生產環境。

## AWS Resilience Hub 運作方式
<a name="how-it-works"></a>

下圖提供如何 AWS Resilience Hub 運作的高階大綱。

![顯示 AWS Resilience Hub 運作方式的流程圖。](http://docs.aws.amazon.com/zh_tw/resilience-hub/latest/userguide/images/digito-how-it-works.png)


**描述**  
從 AWS CloudFormation 堆疊、Terraform 狀態檔案 AWS Resource Groups、Amazon Elastic Kubernetes Service 叢集匯入資源，或從已在 myApplications 中定義的應用程式進行選擇，以描述您的應用程式。

**定義**  
為您的應用程式定義彈性政策。這些政策包括應用程式、基礎設施、可用區域和區域中斷的 RTO 和 RPO 目標。這些目標用於估計應用程式是否符合彈性政策。

**評估**  
在您描述應用程式並將彈性政策連接至應用程式後，請執行彈性評估。 AWS Resilience Hub 評估使用 Well-Architected Framework 的 AWS 最佳實務來分析應用程式的元件，並發現潛在的彈性弱點。這些弱點可能是由基礎設施設定不完整、組態錯誤或需要額外的組態改進的情況所造成。若要改善彈性，請根據評估報告中的建議更新您的應用程式和彈性政策。建議包括元件、警示、測試和復原 SOPs組態。然後，您可以執行另一個評估，並將結果與先前的報告進行比較，以查看改善多少彈性。重複此程序，直到您的預估工作負載 RTO 和預估工作負載 RPO 符合您的 RTO 和 RPO 目標。

**驗證**  
執行測試以測量 AWS 資源的彈性，以及從應用程式、基礎設施、可用區域和 AWS 區域 事件復原所需的時間。為了測量彈性，這些測試會模擬 AWS 資源的中斷。中斷的範例包括網路無法使用錯誤、容錯移轉、已停止的程序、Amazon RDS 開機復原，以及可用區域的問題。

**檢視和追蹤**  
在生產環境中部署 AWS 應用程式後，您可以使用 繼續 AWS Resilience Hub 追蹤應用程式的彈性狀態。如果發生中斷，操作員可以在 中檢視中斷， AWS Resilience Hub 並啟動相關聯的復原程序。