

# OPS02-BP02 确定流程和程序负责人
<a name="ops_ops_model_def_proc_owners"></a>

 了解谁负责定义各个流程和程序、为何使用这些特定的流程和程序，以及为何应由此人负责。了解使用特定流程和程序的原因有助于发现改进机会。

 **期望结果：**针对运营任务，组织制定了一套明确定义并良好维护的流程和程序。流程和程序集中存储在一个位置，可供团队成员使用。按照明确指派的责任归属，经常更新流程和程序。尽可能将脚本、模板和自动化文档作为代码实施。

 **常见反模式：**
+  流程未记录在案。脚本呈现碎片化，可能分布在许多孤立的操作员工作站上。
+  脚本的使用方法只有少数人了解，或作为团队知识非正式地交流。
+  旧的流程需要更新，但不明确应由谁负责更新，原作者已离开了组织。
+  无法发现流程和脚本，因此在需要时（例如，在响应意外事件时）无法使用。

 **建立此最佳实践的好处：**
+  流程和程序可改进运行工作负载的工作。
+  新的团队成员可以更快地投入工作中。
+  缩短了缓解意外事件的用时。
+  不同的团队成员（以及不同的团队）可以一致地使用相同的流程和程序。
+  团队可以使用可重复的流程来扩展其流程。
+  在团队之间移交工作负载责任时，标准化的流程和程序有助于减轻移交造成的影响。

 **在未建立这种最佳实践的情况下暴露的风险等级：**高 

## 实施指导
<a name="implementation-guidance"></a>
+  确定了负责定义流程和程序的负责人。
  +  确定为支持工作负载而开展的运营活动。将这些活动记录在易于发现的位置。
  +  唯一标识负责活动规范的个人或团队。他们负责确保由技能娴熟且具有正确的权限、访问权限和工具的团队成员来成功执行活动。如果执行该活动时遇到问题，执行活动的团队成员有责任提供详细反馈，用于推进活动改进。
  +  通过 AWS Systems Manager 等服务、文档和 AWS Lambda，在活动构件的元数据中收集责任信息。使用标签或资源组收集资源责任信息，详细说明负责人和联系信息。使用 AWS Organizations 创建标记策略，收集负责人和联系信息。
+  随着时间推移，这些程序应该逐步进化为可以作为代码运行，从而减少人工干预的需求。
  +  例如，考虑使用 AWS Lambda 函数、CloudFormation 模板或 AWS Systems Manager Automation 文档。
  +  在相应的存储库中执行版本控制。
  +  包括适当的资源标记，以便可以轻松识别负责人和文档。

 **客户示例** 

 AnyCompany Retail 对“负责人”的定义是：负责某个应用程序或应用程序组（共享通用架构实践和技术）的流程的团队或个人。最初，这些流程和程序以分步指南的形式记录在文档管理系统中，可在托管应用程序的 AWS 账户 上以及账户中的特定资源组上，使用标签来发现。他们利用 AWS Organizations 来管理其 AWS 账户。随着时间的推移，这些流程会转换为代码，并使用基础设施即代码（例如 CloudFormation 或 AWS Cloud Development Kit (AWS CDK) 模板）定义资源。运营流程成为 AWS Systems Manager 中的自动化文档或 AWS Lambda 函数，这些流程可以作为计划任务启动，用于响应 AWS CloudWatch 警报等事件或 AWS EventBridge 事件，也可以通过 IT 服务管理（ITSM）平台内的请求启动。所有流程都有标签，用于标识负责人。用于自动化和流程的文档，保存在由该流程的代码存储库生成的 Wiki 页面中。

### 实施步骤
<a name="implementation-steps"></a>

1.  记录现有的流程和程序。

   1.  查看并保持最新状态。

   1.  确定每个流程或程序的负责人。

   1.  对流程和程序实施版本控制。

   1.  只要可能，对具有相同架构设计的工作负载和环境，共享流程和程序。

1.  建立反馈和改进机制。

   1.  定义有关流程审查频率的政策。

   1.  定义审核者和审批者流程。

   1.  实施问题队列或票证队列，以便提供和跟踪反馈。

   1.  在可能时，流程和程序应由变更审批委员会（CAB）预先审批并进行风险分类。

1.  确认需要运行这些流程和程序的人员能够访问和搜索到流程和程序。

   1.  使用标签来指示可以在哪里访问工作负载的流程和程序。

   1.  使用有意义的错误和事件消息，指明用于解决问题的正确流程或程序。

   1.  使用 Wiki 和文档管理，确保可在整个组织内一致地搜索流程和程序。

1.  使用 [Amazon Q 企业版](https://aws.amazon.com/q/business/)，这是一款对话助手，使用生成式人工智能来提高员工的工作效率、回答问题并根据企业系统中的信息完成任务。

   1.  将 Amazon Q 企业版连接到贵公司的数据来源。Amazon Q 企业版为 40 多个支持的数据来源提供预先构建的连接器，包括 Amazon S3、Microsoft SharePoint、Salesforce 和 Atlassian Confluence。有关更多信息，请参阅 [Amazon Q 连接器](https://aws.amazon.com/q/business/connectors/)。

1.  在适当时实现自动化。

   1.  当服务和技术提供 API 时，应开发自动化功能。

   1.  针对流程充分开展培训。开发用户案例和要求，用于实现这些流程的自动化。

   1.  衡量流程和程序的成功使用情况，并提出问题或票证来支持迭代改进。

 **实施计划的工作量级别：**中 

## 资源
<a name="resources"></a>

 **相关最佳实践：**
+  [OPS02-BP01 确定资源所有者](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_resource_owners.html) 
+  [OPS02-BP04 制定用于管理责任和所有权的机制](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_responsibilities_ownership.html) 
+  [OPS11-BP04 执行知识管理](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **相关文档：**
+  [AWS 白皮书 – AWS 上的 DevOps 简介](https://docs.aws.amazon.com/whitepapers/latest/introduction-devops-aws/automation.html) 
+  [AWS 白皮书 – Best Practices for Tagging AWS Resources](https://docs.aws.amazon.com/whitepapers/latest/tagging-best-practices/tagging-best-practices.html) 
+  [AWS 白皮书 – Organizing Your AWS Environment Using Multiple Accounts](https://docs.aws.amazon.com/whitepapers/latest/organizing-your-aws-environment/organizing-your-aws-environment.html) 
+ [AWS 云 Operations and Migrations Blog - Using Amazon Q Business to streamline your operations ](https://aws.amazon.com/blogs/mt/streamline-operations-using-amazon-q-for-business/)
+  [AWS 云 Operations & Migrations Blog - Build a Cloud Automation Practice for Operational Excellence: Best Practices from AWS Managed Services](https://aws.amazon.com/blogs/mt/build-a-cloud-automation-practice-for-operational-excellence-best-practices-from-aws-managed-services/) 
+  [AWS 云 Operations & Migrations Blog - Implementing automated and centralized tagging controls with AWS Config and AWS Organizations](https://aws.amazon.com/blogs/mt/implementing-automated-and-centralized-tagging-controls-with-aws-config-and-aws-organizations/) 
+  [AWS Security Blog - Extend your pre-commit hooks with AWS CloudFormation Guard](https://aws.amazon.com/blogs/security/extend-your-pre-commit-hooks-with-aws-cloudformation-guard/) 
+  [AWS DevOps Blog - Integrating AWS CloudFormation Guard into CI/CD pipelines](https://aws.amazon.com/blogs/devops/integrating-aws-cloudformation-guard/) 

 **相关讲习会：**
+  [AWS Well-Architected Operational Excellence 讲习会](https://catalog.workshops.aws/well-architected-operational-excellence/en-US/) 
+  [AWS 讲习会 – Tagging](https://catalog.workshops.aws/tagging/) 

 **相关视频：**
+  [How to automate IT Operations on AWS](https://www.youtube.com/watch?v=GuWj_mlyTug) 
+  [AWS re:Invent 2020 - Automate anything with AWS Systems Manager](https://www.youtube.com/watch?v=AaI2xkW85yE) 
+  [AWS re:Inforce 2022 - Automating patch management and compliance using AWS (NIS306)](https://www.youtube.com/watch?v=gL3baXQJvc0) 
+  [支持s You - Diving Deep into AWS Systems Manager](https://www.youtube.com/watch?v=xHNLNTa2xGU) 

 **相关服务：**
+  [AWS Systems Manager – 自动化](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 
+  [AWS 服务管理连接器](https://aws.amazon.com/service-management-connector/) 