内容领域 3:韧性云解决方案
任务说明 3.1:实施高度可用的解决方案以满足韧性和业务要求。
掌握以下知识:
多可用区和多区域部署(例如,计算层、数据层)
SLA
有状态服务的复制和故障转移方法
实现高可用性的技术(例如,多可用区、多区域)
具备以下技能:
将业务要求转化为技术韧性需求
找出并修复现有工作负载中的单点故障
在可用的情况下启用跨区域解决方案(例如 Amazon DynamoDB、Amazon RDS、Amazon Route 53、Amazon S3、Amazon CloudFront)
配置负载均衡以支持跨可用区服务
配置应用程序和相关服务以支持多个可用区和 AWS 区域,同时最大限度减少停机
任务说明 3.2:实施可扩展以满足业务要求的解决方案。
掌握以下知识:
用于扩缩服务的相应指标
松散耦合的分布式架构
无服务器架构
容器平台
具备以下技能:
找出并修复扩缩问题
确定并实施相应的弹性伸缩、负载均衡和缓存解决方案
部署基于容器的应用程序(例如,Amazon Elastic Container Service [Amazon ECS]、Amazon Elastic Kubernetes Service [Amazon EKS])
在多个区域部署工作负载以实现全球可扩展性
配置无服务器应用程序(例如 Amazon API Gateway、AWSLambda、AWS Fargate)
任务说明 3.3:实施自动化恢复流程,满足 RTO 和 RPO 要求。
掌握以下知识:
灾难恢复概念(例如 RTO、RPO)
AWS 备份和恢复策略(例如 Pilot light、暖备用)
恢复过程
具备以下技能:
测试多可用区和多区域工作负载(例如 Amazon RDS、Amazon Aurora、Route 53、CloudFront)的故障转移
确定并实施相应的跨区域 AWS 备份和恢复策略(例如 AWS Backup、Amazon S3、AWS Systems Manager)
配置负载均衡器以从后端故障中恢复