使用 L CloudWatch ogs Insights 监控应用程序活动 - AWS 规范指引

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 L CloudWatch ogs Insights 监控应用程序活动

Ram Kandaswamy,Amazon Web Services

Summary

此模式为使用 Amazon Lo CloudWatch gs Insights 自动检测应用程序异常并发出警报提供了解决方案。通过实施自动日志分析及提醒机制,您可以快速识别和响应生产环境中出现的应用程序问题。

日志在监控系统行为、识别问题和确保最佳性能方面发挥着至关重要的作用。在迁移过程中,日志文件对于验证系统在新环境中的运行情况、检测兼容性问题、识别异常行为非常有帮助。问题可能与操作或安全相关。对于安全相关问题,及早发现未经授权的访问企图或可疑活动对于维护安全和监管合规性至关重要。在处理敏感数据或关键系统时,这种能力尤为重要。

对于需要执行以下操作的团队来说,这种模式特别有价值:

  • 保持应用程序的高可用性。

  • 快速响应生产问题。

  • 分析未被日志捕获的特定于应用程序的 AWS 服务 错误。

  • 无需预建基础架构即可按需执行日志分析。

CloudWatch Logs Insights 最适合分析应用程序生成的日志,其中错误上下文仅存在于应用程序代码中。 CloudWatch Logs Insights 擅长以下任务:

  • 查询非结构化或半结构化日志数据。

  • 在事件响应期间进行按需分析。

  • 关联多个日志组中的事件。

  • 无需外部工具即可快速创建可视化效果。

先决条件和限制

先决条件

  • 在活动状态下部署的生产应用程序 AWS 账户

  • 基本了解生产应用程序的日志格式和异常模式

  • 配置为流式传输到 Amazon CloudWatch 日志的应用程序日志

限制

架构

下图显示了 CloudWatch Logs Insights 如何评估资源日志并将相关的数据可视化发送到 CloudWatch 仪表板。

CloudWatch Logs Insights 评估资源日志,并将数据可视化发送到仪表板。

下图显示了如下工作流:

  1. 这些资源将日志发布到 CloudWatch 日志。资源可以包括诸如亚马逊弹性计算云 (Amazon EC2) 实例或亚马逊简单存储服务 (Amazon S3) Simple Service 存储桶之类的 AWS 资源。另一个示例包括安装了 CloudWatch 代理的本地系统,这些系统可以将日志发布到 CloudWatch。

  2. CloudWatch 记录相关模式字符串的 Insights 过滤器。搜索模式字符串的示例包括“error”、“exception”或特定正则表达式。

  3. 通常,生产支持团队或开发人员会将模式可视化添加到 CloudWatch 仪表板中。

自动化和扩展

开发人员可以通过使用 AWS Cloud Development Kit (AWS CDK) AWS CloudFormation、或来处理多个字符串模式 AWS SDKs 来自动执行此模式的解决方案。团队可以将这种自动化整合到他们的持续集成和部署 (CI/CD) DevOps 流程中。

工具

AWS 服务

最佳实践

查询效率

  • 定义和配置日志组以分析相关日志数据。

  • 通过字段浏览器了解日志数据中可用的结构和字段。

  • 使用 L CloudWatch ogs Insights 查询语法编写高效的查询。

  • 根据您的特定要求调整查询示例,以加快分析速度。

  • 限制查询时间范围以减少扫描的数据并提高性能。

  • 保存查询以备将来使用,从而节省时间并确保分析一致性。

安全性

成本优化

  • CloudWatch Logs Insights 按每次查询扫描的 GB 数据收费。缩小时间范围并针对特定的日志组以降低成本。

  • 配置适当的日志保留策略来管理存储成本。

  • 要频繁分析大型历史数据集,可以考虑将日志导出到 Amazon S3 并使用 Amazon Athena。

  • 查看CloudWatch 定价以了解您的用例对成本的影响。

操作说明

Task说明所需技能

配置 IAM 权限。

要配置 IAM 权限,请执行以下操作:

  1. 确定应用程序用于写入日志的 IAM 角色,以及创建控制面板、查询和警报的用户或服务使用的 IAM 角色。

  2. 对于应用程序角色,将以下 API 操作及资源添加到策略中:

    { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "logs:CreateLogGroup", "logs:CreateLogStream", "logs:PutLogEvents" ], "Resource": [ "arn:aws:logs:*:*:*" ] } ] }
  3. 要管理 CloudWatch 资源,请在策略中添加以下内容:

    { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "cloudwatch:PutDashboard", "cloudwatch:GetDashboard", "logs:StartQuery", "logs:StopQuery", "logs:GetQueryResults", "cloudwatch:PutMetricAlarm" ], "Resource": "*" } ] }

有关如何创建 IAM 策略或者向现有策略添加权限的信息,请参阅 《IAM 用户指南》中的使用客户管理型策略自定义 IAM 权限编辑 IAM 策略。有关更多信息,请参阅 Amazon Logs 用户指南中的 Amazon CloudWatch CloudWatch 日志和日志的身份和访问管理权限参考。 CloudWatch

AWS 管理员、AWS DevOps、AWS 系统管理员、云管理员、云架构师、 DevOps 工程师

创建日志组。

要创建日志组,请使用以下任一选项:

  • 创建或打开.json扩展名为或的 CloudFormation 模板文件(YAML 或 JSON 格式)。.yaml(下列代码使用 YAML 格式。) 将以下资源定义添加到模板的资源部分:

    MyLogGroup: Type: AWS::Logs::LogGroup Properties: LogGroupName: my-log-group

    有关更多信息,请参阅 Amazon L CloudWatch ogs 用户指南中的快速入门:使用 AWS CloudFormation CloudWatch 日志入门。

  • 按照《Amazon Logs 用户指南》的 “ CloudWatch 日志” 中的创建 CloudWatch 日志中所述使用 CloudWatch 控制台。

  • 使用日CloudWatch 志 API 中的CreateLogGroup操作。

AWS 管理员、AWS DevOps、AWS 系统管理员、云管理员、云架构师、 DevOps 工程师

生成 “ CloudWatch 日志见解” 查询。

要创建和保存 CloudWatch Logs Insights 查询,请执行以下操作:

  1. 打开控制 CloudWatch 台。

  2. 导航到 Logs Insights

  3. 使用以下任一方法创建查询:

    • 查询部分的查询示例开始。

    • 编写自定义查询。

    • 修改以下查询示例:

      fields @timestamp, @message | filter @message like /(?i)exception/|stats count() by bin(30s)

      此查询会检查日志文件,提取时间戳和消息内容,筛选“exception”一词(不区分大小写),并以 30 秒为间隔计算出现次数。

AWS 管理员、AWS DevOps、AWS 系统管理员、云管理员、云架构师、 DevOps 工程师

在 CloudWatch 仪表板中创建可视化。

要使用 CloudWatch 仪表板创建可视化,请执行以下操作:

  1. 打开 CloudWatch 控制台,然后创建 CloudWatch 仪表板(如果还没有)或打开现有的仪表板。

  2. 添加异常监控可视化内容。可根据您的业务需要生成柱状图、折线图和饼图。有关更多信息,请参阅 Amazon Log CloudWatch s 用户指南中的在 CloudWatch 控制面板上使用小组件。对于实时数据可视化,您可以根据自己的要求自定义小组件。

有关控制面板选项和功能的更多信息,请参阅 Amazon Lo CloudWatch gs 用户指南中的使用 Amazon 控制 CloudWatch 面板和使用控制面板变量创建灵活的控制面 CloudWatch 板

AWS 管理员、AWS DevOps、AWS 系统管理员、云管理员、云架构师、 DevOps 工程师

问题排查

问题解决方案

看不到查询结果或查询似乎失效

从基于查询示例修改而成的可运行查询开始。https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_QuerySyntax-examples.html对查询的各个部分(例如筛选器或字段)进行少量增量更改,并利用 CloudWatch 日志查询生成器功能

日志组未创建日志流

在 IAM 策略中,确保为CreateLogStreamCreateLogGroup操作的资源提供了通配符(*)值。如果没有此通配符权限,create 操作将无法成功。

查询超时或性能降低

缩短时间范围,瞄准特定的日志组,或者简化查询。复杂的正则表达式 (regex) 模式和较大的时间范围会增加查询时间。

未返回有效时间范围内的数据

验证日志组选择并检查是否正在提取日志(查看日志流),并确认筛选模式与您的日志格式匹配。

相关资源