本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 L CloudWatch ogs Insights 监控应用程序活动
Ram Kandaswamy,Amazon Web Services
Summary
此模式为使用 Amazon Lo CloudWatch gs Insights 自动检测应用程序异常并发出警报提供了解决方案。通过实施自动日志分析及提醒机制,您可以快速识别和响应生产环境中出现的应用程序问题。
日志在监控系统行为、识别问题和确保最佳性能方面发挥着至关重要的作用。在迁移过程中,日志文件对于验证系统在新环境中的运行情况、检测兼容性问题、识别异常行为非常有帮助。问题可能与操作或安全相关。对于安全相关问题,及早发现未经授权的访问企图或可疑活动对于维护安全和监管合规性至关重要。在处理敏感数据或关键系统时,这种能力尤为重要。
对于需要执行以下操作的团队来说,这种模式特别有价值:
保持应用程序的高可用性。
快速响应生产问题。
分析未被日志捕获的特定于应用程序的 AWS 服务 错误。
无需预建基础架构即可按需执行日志分析。
CloudWatch Logs Insights 最适合分析应用程序生成的日志,其中错误上下文仅存在于应用程序代码中。 CloudWatch Logs Insights 擅长以下任务:
查询非结构化或半结构化日志数据。
在事件响应期间进行按需分析。
关联多个日志组中的事件。
无需外部工具即可快速创建可视化效果。
先决条件和限制
先决条件
在活动状态下部署的生产应用程序 AWS 账户
基本了解生产应用程序的日志格式和异常模式
配置为流式传输到 Amazon CloudWatch 日志的应用程序日志
限制
有些 AWS 服务 并非全部可用 AWS 区域。有关区域可用性,请参阅按区域划分的AWS 服务
。有关特定端点,请参阅服务端点和配额,然后选择相应服务的链接。
架构
下图显示了 CloudWatch Logs Insights 如何评估资源日志并将相关的数据可视化发送到 CloudWatch 仪表板。

下图显示了如下工作流:
这些资源将日志发布到 CloudWatch 日志。资源可以包括诸如亚马逊弹性计算云 (Amazon EC2) 实例或亚马逊简单存储服务 (Amazon S3) Simple Service 存储桶之类的 AWS 资源。另一个示例包括安装了 CloudWatch 代理的本地系统,这些系统可以将日志发布到 CloudWatch。
CloudWatch 记录相关模式字符串的 Insights 过滤器。搜索模式字符串的示例包括“error”、“exception”或特定正则表达式。
通常,生产支持团队或开发人员会将模式可视化添加到 CloudWatch 仪表板中。
自动化和扩展
开发人员可以通过使用 AWS Cloud Development Kit (AWS CDK) AWS CloudFormation、或来处理多个字符串模式 AWS SDKs 来自动执行此模式的解决方案。团队可以将这种自动化整合到他们的持续集成和部署 (CI/CD) DevOps 流程中。
工具
AWS 服务
Amazon CloudWatch Lo gs 可帮助您集中所有系统和应用程序的日志, AWS 服务 这样您就可以监控它们并安全地将其存档。
AWS Identity and Access Management (IAM) 通过控制谁经过身份验证并有权使用 AWS 资源,从而帮助您安全地管理对资源的访问权限。
AWS Key Management Service (AWS KMS) 可帮助您创建和控制加密密钥以帮助保护您的数据。
最佳实践
查询效率
定义和配置日志组以分析相关日志数据。
通过字段浏览器了解日志数据中可用的结构和字段。
使用 L CloudWatch ogs Insights 查询语法编写高效的查询。
根据您的特定要求调整查询示例,以加快分析速度。
限制查询时间范围以减少扫描的数据并提高性能。
保存查询以备将来使用,从而节省时间并确保分析一致性。
安全性
对 CloudWatch 日志见解和日志组应用适当的 IAM 策略。遵循最低权限原则,并授予执行任务所需的最低权限。有关详情,请参阅 IAM 文档中的授予最低权限和安全最佳实践。
对敏感的日志数据启用 AWS KMS日志数据加密。
成本优化
CloudWatch Logs Insights 按每次查询扫描的 GB 数据收费。缩小时间范围并针对特定的日志组以降低成本。
配置适当的日志保留策略来管理存储成本。
要频繁分析大型历史数据集,可以考虑将日志导出到 Amazon S3 并使用 Amazon Athena。
查看CloudWatch 定价
以了解您的用例对成本的影响。
操作说明
| Task | 说明 | 所需技能 |
|---|---|---|
配置 IAM 权限。 | 要配置 IAM 权限,请执行以下操作:
有关如何创建 IAM 策略或者向现有策略添加权限的信息,请参阅 《IAM 用户指南》中的使用客户管理型策略自定义 IAM 权限和编辑 IAM 策略。有关更多信息,请参阅 Amazon Logs 用户指南中的 Amazon CloudWatch CloudWatch 日志和日志的身份和访问管理权限参考。 CloudWatch | AWS 管理员、AWS DevOps、AWS 系统管理员、云管理员、云架构师、 DevOps 工程师 |
创建日志组。 | 要创建日志组,请使用以下任一选项:
| AWS 管理员、AWS DevOps、AWS 系统管理员、云管理员、云架构师、 DevOps 工程师 |
生成 “ CloudWatch 日志见解” 查询。 | 要创建和保存 CloudWatch Logs Insights 查询,请执行以下操作: | AWS 管理员、AWS DevOps、AWS 系统管理员、云管理员、云架构师、 DevOps 工程师 |
在 CloudWatch 仪表板中创建可视化。 | 要使用 CloudWatch 仪表板创建可视化,请执行以下操作:
有关控制面板选项和功能的更多信息,请参阅 Amazon Lo CloudWatch gs 用户指南中的使用 Amazon 控制 CloudWatch 面板和使用控制面板变量创建灵活的控制面 CloudWatch 板。 | AWS 管理员、AWS DevOps、AWS 系统管理员、云管理员、云架构师、 DevOps 工程师 |
问题排查
| 问题 | 解决方案 |
|---|---|
看不到查询结果或查询似乎失效 | 从基于查询示例修改而成的可运行查询开始。https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_QuerySyntax-examples.html对查询的各个部分(例如筛选器或字段)进行少量增量更改,并利用 CloudWatch 日志查询生成器功能。 |
日志组未创建日志流 | 在 IAM 策略中,确保为CreateLogStream和CreateLogGroup操作的资源提供了通配符 |
查询超时或性能降低 | 缩短时间范围,瞄准特定的日志组,或者简化查询。复杂的正则表达式 ( |
未返回有效时间范围内的数据 | 验证日志组选择并检查是否正在提取日志(查看日志流),并确认筛选模式与您的日志格式匹配。 |