内容领域 4: 监控和日志记录
任务说明 4.1: 配置日志及指标的收集、聚合和存储。
掌握以下知识:
如何监控应用程序和基础设施
Amazon CloudWatch 指标(例如,命名空间、指标、维度和分辨率)
实时摄取日志
静态和传输中的日志和指标的加密选项(例如,客户端和服务器端、AWS Key Management Service [AWS KMS])
安全配置(例如,允许收集日志的 IAM 角色和权限)
具备以下技能:
安全地存储和管理日志
使用指标筛选条件从日志事件中创建 CloudWatch 指标
创建 CloudWatch 指标流(例如 Amazon S3 或 Amazon Kinesis Data Firehose 选项)
收集自定义指标(例如,使用 CloudWatch 代理)
管理日志存储生命周期(例如 Amazon S3 生命周期、CloudWatch 日志组保留)
使用 CloudWatch 日志订阅处理日志数据(例如 Amazon Kinesis、AWS Lambda、Amazon OpenSearch Service)
使用筛选条件和模式语法或 Amazon CloudWatch Logs Insights 搜索日志数据
配置日志数据加密(例如 AWS KMS)
任务说明 4.2: 审计、监控和分析日志及指标以检测问题。
掌握以下知识:
异常检测警报(例如 CloudWatch 异常检测)
常见的 CloudWatch 指标和日志(例如 Amazon EC2 的 CPU 使用率、Amazon RDS 的队列长度、应用程序负载均衡器 [ALB] 的 5xx 错误)
Amazon Inspector 和常见的评估模板
AWS Config 规则
AWS CloudTrail 日志事件
具备以下技能:
构建 CloudWatch 控制面板和 Amazon QuickSight 可视化内容
将 CloudWatch 警报与 CloudWatch 指标(标准和自定义)相关联
为不同的服务配置 AWS X-Ray(例如,容器、Amazon API Gateway、Lambda 函数)
分析实时日志流(例如,使用 Amazon Kinesis Data Streams)
使用 AWS 服务分析日志(例如 Amazon Athena、CloudWatch Logs Insights)
任务说明 4.3: 为复杂环境自动执行监控和事件管理。
掌握以下知识:
事件驱动的异步设计模式(例如,发送到 Amazon Simple Notification Service [Amazon SNS] 或 Lambda 的 S3 事件通知或 Amazon EventBridge 事件)
各种 AWS 服务的弹性伸缩能力(例如,EC2 自动扩缩组、RDS 存储弹性伸缩、Amazon DynamoDB、Amazon Elastic Container Service [Amazon ECS] 容量提供程序、Amazon Elastic Kubernetes Service [Amazon EKS] Autoscaler)
警报通知和操作功能(例如,发送到 Amazon SNS 或 Lambda 的 CloudWatch 警报、EC2 自动恢复)
AWS 服务中的运行状况检查功能(例如 ALB 目标组、Amazon Route 53)
具备以下技能:
为自动扩缩配置相应的解决方案(例如 DynamoDB、EC2 自动扩缩组、RDS 存储自动扩缩、ECS 容量提供程序)
创建 CloudWatch 自定义指标和指标筛选条件、警报和通知(例如 Amazon SNS、Lambda)
配置 S3 事件以处理日志文件(例如,使用 Lambda),并将日志文件传送到另一个目的地(例如 OpenSearch Service、CloudWatch Logs)
配置 EventBridge 以根据特定事件模式发送通知
在 EC2 实例上安装和配置代理(例如 AWS Systems Manager Agent [SSM Agent]、CloudWatch 代理)
配置 AWS Config 规则以修复问题
配置运行状况检查(例如 Route 53、ALB)