适用于自动化的 AWS 服务 - AWS 规范指引

适用于自动化的 AWS 服务

可以使用多种 AWS 服务来实现 IT 运营自动化。下表按职能列出了 21 个 OI 领域,并提供相关信息来协助您根据不同运营需求选择合适的服务。

核心运营职能:

启动焦点和工具

平台架构和治理

企业范围的治理、安全基准、多账户策略及自动合规性。通常通过部署 AWS 登录区解决方案、AWS Control TowerAWS Managed Services 来实施。

事件和事件管理

使用 Amazon CloudWatch、AWS Systems Manager 的 Incident Manager 功能、Amazon Simple Notification Service(Amazon SNS)以及 Amazon DevOps Guru 进行日志记录、监控、自动化事件响应和事件关联。

预配置和配置管理

使用 AWS Service CatalogAWS CloudFormationAWS Cloud Development Kit (AWS CDK)AWS ProtonAWS Systems ManagerAWS Config 实施基础设施即代码(IaC)、自动部署和配置合规性。

可用性及业务连续性管理

通过使用 AWS Resilience HubAWS Elastic Disaster RecoveryAWS Backup 实施高可用性、弹性、灾难恢复和业务连续性。

监控和可观测性

通过使用 Amazon CloudWatch(指标、日志、警报)、AWS Health服务配额AWS X-RayAmazon Managed GrafanaAmazon Managed Service for Prometheus,实现运营可见性,主动监控并自动响应服务运行状况问题。

安全和控制职能:

启动焦点和工具

变更管理

使用 AWS ConfigChange Manager(AWS Systems Manager 的一项功能)、AWS Audit ManagerAWS CloudTrail 控制合规性、管理风险和跟踪变更。

资产管理

使用 AWS 资源探索器InventoryFleet Manager(AWS Systems Manager 的功能)、AWS Config 以及自动标记策略,实现透明度和资源生命周期跟踪。

身份和访问管理

通过 AWS Identity and Access Management(IAM)实施最低权限原则,利用 AWS IAM Identity Center 实现单点登录,并与 AWS Directory Service 进行联合身份验证,这些通常通过安全工作流来实现。

安全管理

通过 AWS Security Hub CSPMAmazon GuardDutyAmazon DetectiveAmazon InspectorAmazon MacieAWS WAFAWS ShieldAWS Network Firewall 实施安全控制与事件响应,由安全工作团队指定,具备自动化安全评测与修复能力。例如,请参阅 AWS 规范指引网站上的使用 AWS Systems Manager 自动修补混合云中的可变实例

合规性与风险管理

使用 AWS ArtifactAWS ConfigAWS Audit ManagerAWS Security Hub CSPMAWS Control Tower 实现监管合规性、自动审计及持续风险评估。

数据治理和主权管理

使用 AWS GovCloud (US) 处理政府工作负载、使用 AWS European Sovereign Cloud 处理欧盟数据主权、使用 AWS 区域特定部署,实现数据分类、区域合规性要求(例如通用数据保护条例 [GDPR])和数据驻留控制。

业务管理职能:

启动焦点和工具

FinOps 管理

使用 AWS Cost ExplorerAWS BudgetsAWS Cost Anomaly DetectionAWS Trusted AdvisorAWS Billing Conductor 和成本标签策略进行成本优化、治理和账单报告。

容量规划和预测

使用 AWS Cost Explorer 预测功能进行容量预测,使用 AWS Compute OptimizerAWS Trusted AdvisorAWS Budgets 进行资源优化。

组织变革管理(OCM)

培训、沟通、转换支持、采用框架,以及管理云转型的人员方面

供应商管理

通过 AWS MarketplaceAWS License ManagerAWS Partner Network、外包提供商控制与集成来管理许可证和提供商。

可持续性管理

使用 AWS 客户碳足迹工具监测与优化环境影响,采用 AWS Graviton 处理器提高每瓦特性能,实施 AWS Well-Architected Sustainability Pillar,并作出以可持续性为核心的架构决策。

云端价值最大化

通过优化成本、提升运营效率并有效利用云端能力,最大限度地发挥 AWS 云的商业价值。这包括通过使用 AWS Cost Explorer 和实施战略采购方案(节省计划预留实例竞价型实例),同时利用 AWS Compute Optimizer 进行资源适配和总拥有成本(TCO)分析,理解成本驱动因素。目标是在成本优化与性能及创新之间取得平衡,确保云投资既能推动业务成果,又可支持增长目标。

支持性职能:

启动焦点和工具

报告和分析

通过使用 Amazon OpenSearch ServiceAmazon Quick SuiteAmazon AthenaCloudWatch 分析与监控功能,监控使用趋势和服务运行状况。

持续改进

使用 AWS Trusted AdvisorAmazon DevOps GuruAWS Well-Architected ToolOpsCenter(AWS Systems Manager 的一项功能)来处理迭代,实现卓越运营。

应用程序生命周期管理

软件开发生命周期、人员、流程与工具集成,基于 Amazon Q 开发者版AWS CodeBuildAWS CodeDeployAWS CodePipeline 的 DevOps 工作流。

人工智能/机器学习运营

通过 CloudWatch 异常检测CloudWatch 调查以及 Amazon DevOps Guru 提升运营能力,用于预测性监控和问题检测;借助 AWS Security Hub CSPMAmazon GuardDutyAmazon Detective 实现基于机器学习的威胁检测与调查;并采用人工智能驱动的文档处理架构可视化解决方案,简化运营流程并提升事件响应能力。