

# 改善工作负载
<a name="improving-your-workload"></a>

 此时，您已经为 WAFR 做好了准备，完成了审查，并根据 AWS 最佳实践评测了工作负载。

 来自 WAFR 的输出将根据在审查期间获得的答案确定架构风险。这些风险分类为*高风险问题（HRI）*和*中等风险问题（MRI）*。

 在最后阶段，您将制定一项改进计划，其中包括创建风险列表，了解风险对业务的影响，确定解决方案，并根据组织的优先事项实施这些解决方案。

 以下各节提供了有关工作负载改进过程的详细指导：
+  识别和了解风险 
+  确定规范性解决方案 
+  确定改进的优先顺序 
+  实施和跟踪改进 

 以下循环显示了 WAFR 的*改进*阶段中包含的主要步骤。

![\[改进循环\]](http://docs.aws.amazon.com/zh_cn/wellarchitected/latest/userguide/images/improvement_cycle.png)


# 识别和了解风险
<a name="identify-and-understand-risks"></a>

 将已确定的风险视为改进机会。

 WAFR 的上下文中存在两类风险：*高风险问题（HRI）*和*中等风险问题（MRI）*。
+  **高风险问题（HRI）：**可能会对企业造成严重负面影响的架构和运营选择。高风险最佳实践被视为支柱中必须实施的基础实践。它们可能会影响组织的运营、资产和个人。安全支柱中的一个 HRI 示例是未对您的 AWS 账户实施保护。
+  **中等风险问题（MRI）：**可能对企业产生负面影响的选择，但其影响程度低于 HRI。中等风险最佳实践表示可以显著改善工作负载的有利实践。安全支柱中的一个 MRI 示例是未定期审计和轮换凭证。

## 生成报告
<a name="generating-a-report"></a>

 直观识别 HRI 和 MRI 的第一步是生成一份报告，其中显示您所审查的每个工作负载的风险。

 [AWS Well-Architected Tool（AWS WA Tool）控制面板](https://docs.aws.amazon.com/wellarchitected/latest/userguide/dashboard.html)可提供对工作负载及其关联 HRI 和 MRI 的访问。您还可以纳入已与您共享的工作负载。使用此控制面板，您可以按工作负载、支柱或严重性（高或中等）筛选问题。

 在控制面板页面中，您可以查看按支柱或严重性筛选的 HRI 和 MRI 的列表。选择改进项目后，它会直接引导您从 Well-Architected Framework 中找到与之关联的最佳实践。从那里，您可以阅读修复问题所需采取的建议措施以及必要的资源。

 您可以从 WA Tool 控制面板中选择[生成报告](https://docs.aws.amazon.com/wellarchitected/latest/userguide/workloads-report.html)，将所有这些调查发现合并到一份报告中。

 我们建议将摘要电子邮件连同报告一起发送给 WAFR 参会者，并总结主要调查发现和建议的改进计划，让他们为下一步做好准备。

## 管控风险
<a name="managing-risks"></a>

 为了有效地管控风险，定义风险及其可接受程度至关重要。通过风险分析，探索潜在的问题是什么，以及如何知道它们是否就是问题所在。

 进行风险评测的主要方法有两种：
+  **定量：**使用加权客观数据来评测风险在成本超支、资源消耗和进度延误方面的影响。
+  **定性：**使用与成本或收益的实际值无关的主观数据来衡量概率和整体影响。

 在某些情况下，您可能会采用一种折中的方法，将两种方法的优点结合起来，以评估风险的影响。

 在根据 HRI 和 MRI 定义评估风险级别时，考虑提出以下问题：
+  风险导致影响的可能性有多大？ 
+  会对客户产生什么样的影响？ 
+  结果会对业务产生什么影响？ 
+  是能够完全消除风险，还是只能降低风险？ 
+  谁承担风险？ 
+  谁负责开展消除或降低风险的改进工作？ 
+  这种结果再次发生的可能性有多大？ 它可能造成同样的影响吗？ 
+  您能确定结果的可能性与复发模式之间的关系吗？ 

 让关键利益相关者或企业主回答这些问题，将有助于您列出需要重点关注的最严重风险以及解决这些风险的预计时间。

## 风险程度
<a name="risk-magnitude"></a>

 您可以使用下表来协助您确定风险程度：


|  可能性 x 影响  |  可忽略不计（1）  |  小（2）  |  中等（3）  |  大（4）  |  严重（5）  | 
| --- | --- | --- | --- | --- | --- | 
|  几乎可以肯定（5）  |  5  |  10  |  15  |  20  |  25  | 
|  很可能（4）  |  4  |  8  |  12  |  26  |  20  | 
|  可能（3）  |  3  |  6  |  9  |  12  |  15  | 
|  不太可能（2）  |  2  |  4  |  6  |  8  |  10  | 
|  极不可能（1）  |  1  |  2  |  3  |  4  |  5  | 

 以小组形式开展工作，共同探讨 HRI 和 MRI 及其给企业带来的风险。创建需要解决的 HRI 列表。根据业务关键程度对风险进行排名，以确定优先级。

# 确定规范性解决方案
<a name="determine-prescriptive-solutions"></a>

 一旦了解了组织环境中的风险和改进机会，就需要与团队合作来采取缓解措施。在这个阶段，每个团队都需要研究在各自领域中发现的 HRI，并确定用于解决 HRI 的规范性解决方案。

 此步骤可能要求进行额外的研究、讨论或建立概念验证。在此阶段，不要花太多时间探究解决方案的实施细节，这一点至关重要。如果您决定将所讨论的 HRI 作为优先事项，那么稍后就会探讨实施细节。

 此步骤的目的是了解解决方案的复杂性以及需要哪些资源，以便在根据时间、复杂性和影响确定任务优先级时将它们考虑在内。

 以小组形式开展工作，为 HRI 收集可能的解决方案列表。保持高层级，不要涉及实施细节。

# 确定改进的优先顺序
<a name="prioritize-improvements"></a>

 任何组织都不会拥有无限的时间和资源。同时解决所有已确定的 HRI 和 MRI 可能不是充分利用 WAFR 的正确方法。

 从选定数量的问题开始，这些问题可能对业务产生最大影响且更易于实施。研究和制定解决方案。跟踪改进，然后对该方法进行迭代。

## 确定实施的优先顺序
<a name="prioritize-for-implementation"></a>

 一种有助于您可视化解决方案优先级的方法是[艾森豪威尔式图](https://www.eisenhower.me/eisenhower-matrix/)。可通过不同的方法使用该工具。在评估时，既要考虑改进的重要性（它会给您的业务带来多少价值），也要考虑实施改进所要付出的努力（所需的时间、实施的复杂性或员工人数）。

![\[艾森豪威尔图\]](http://docs.aws.amazon.com/zh_cn/wellarchitected/latest/userguide/images/eisenhower.png)


 这一分析的输出提供了一组风险，这些风险对您的业务影响最大，但实施起来并不太复杂。这些风险是在第一次迭代中开始实施的良好候选项。

## 解决方案特征
<a name="solution-characteristics"></a>

 在为已确定的风险选择解决方案时，请注意以下各项：
+  [https://www.forbes.com/advisor/business/smart-goals/](https://www.forbes.com/advisor/business/smart-goals/)考虑具体、可衡量、可实现、相关和有时限（SMART）的目标。
+  **所有者：**为每个解决方案确定所有者。
+  **简单胜于复杂：**复杂的解决方案可以奏效，但它们会使改进更难以实施，并且可能需要更长的时间来制定。除非复杂的解决方案是不容商议的要求，否则选择简单性而非复杂性。
+  [https://aws.amazon.com/executive-insights/content/how-amazon-defines-and-operationalizes-a-day-1-culture/](https://aws.amazon.com/executive-insights/content/how-amazon-defines-and-operationalizes-a-day-1-culture/)解决方案应具有可扩展性，旨在随着时间推移而改进和发展。如果可能，请避免使用无法随着架构发展而适应的静态解决方案。
+  **基于目标模式的解决方案：**考虑可以编码、重用和重复共享的解决方案。而不必做重复的工作。访问 [AWS Architecture Center](https://aws.amazon.com/architecture/) 来查看示例。
+  **以团队形式持续开展工作：**以小组形式开展工作，为 HRI 创建解决方案列表。在艾森豪威尔矩阵中对它们进行优先级排序。

# 实施和跟踪改进
<a name="implement-and-track-improvements"></a>

 成功实施的理想结果是减少 HRI 和 MRI，从而改善工作负载的架构运行状况。

 补救措施的实施应以迭代方式进行，使用 WA Tool 中的里程碑记录特定时间点的工作负载状态。每次召开审查会议或完成改进项目时，都要保存一个里程碑，以便随时衡量进度。

## WAFR 的敏捷性
<a name="wafr-in-agile"></a>

 来自 WAFR 优先级排序实践的输出可用于为开发团队的冲刺事项和待办事项确定优先级。开发人员应该能够理解实施所带来的影响，并负责为改善架构运行状况做出贡献。WAFR 的改进和跟踪可以整合到敏捷回顾中。

 回顾是在迭代或冲刺事项结束时举行的会议。在回顾期间，团队反思迭代中发生的事情，并确定后续的改进措施。这是一种理想的机制，可以纳入 WAFR 审查以供讨论，并增强成员在改善架构运行状况方面的能力。

## 时间轴
<a name="timeline"></a>

 这些步骤的时间表因组织而异，因为每个组织各不相同，面临的挑战也是独特的。但是，在 AWS 中与许多客户成功执行 WAFR 后，我们建议此阶段为 90 到 180 天。

 如果您的 HRI 和 MRI 列表需要更长的时间，请重新确定它们的优先顺序，然后提出一个更短的列表，这样您就可以开始实施这个流程以获得一些改进。然后，对剩余的项目重复上述操作。

## WAFR 之后的时间表
<a name="timeline-after-the-wafr"></a>

 **WAFR 结束后次日：**

1. 撰写一封包含改进计划的简要电子邮件，并总结：
   + 谁参与了审查
   + 关键调查发现
   + 后续步骤的时间表

1. 附加改进计划

1. 指导团队做好计划

 **WAFR 结束后两到三天：**

1. 召开一次 HRI 优先级排序会议，并对 HRI 进行优先级排序：
   + 按工作量
   + 按影响
   + 以及负责工作负载的团队

1. 就对业务真正最重要的事项进行协作

 **WAFR 结束后一周：**

1. 启动改进计划

1. 请考虑以下建议：
   + **持续时间：**90 或 180 天
   + 确定 HRI 优先级
   + 针对每个 HRI 制定缓解措施
   + 尝试尽量采取各种措施来解决多个 HRI

 **例行任务：**

1. 为有关改进计划的后续会议制定节奏

1. 审查为改善工作负载而采取的行动

1. 请考虑以下建议：
   + 设定与会者的预期
   + 向他们发送 WA 问题链接
   + 执行后续审查