CloudWatch 调查 - Amazon CloudWatch

CloudWatch 调查

CloudWatch 调查是一款采用生成式人工智能的助手,可以帮助您应对系统中的事件。该功能使用生成式人工智能扫描系统的遥测数据,并快速显示可能与您的问题相关的遥测数据和建议。这些建议包括指标、日志、部署事件以及涉及多个资源时直观表示的根本原因假设分析。有关人工智能助手可以显示的数据类型的完整列表,请参阅 CloudWatch 调查可在调查过程中揭示的洞察

您无需在 CloudWatch 操作问题排查中进行任何额外配置即可进行调查。当您开始调查时,CloudWatch 调查功能会使用与登录用户关联的权限,调查和分析与警报、指标或 Logs Insights 查询相关的资源,并提供问题排查建议。调查不会创建任何资源,且 CloudWatch 调查功能所采取的每项操作都会记录在 CloudTrail 中以实现可追溯性。调查会提供以下信息,以帮助您进行操作问题排查:

  • 查看人工智能生成的观测结果、建议和假设

  • 访问多资源假设的可视化表示

  • 查看自然语言解释和根本原因分析

  • 获取对遥测数据的人工智能分析,包括指标、日志、部署事件、AWS Health 事件、CloudTrail 更改事件、X-Ray 跟踪数据和 CloudWatch Logs Insights 查询

    配置 CloudWatch 调查功能有助于您进行更深入地调查。

配置 CloudWatch 调查功能后,调查还将提供以下额外功能:

  • 接受或丢弃建议和观测结果

    对于每项建议,您可以决定是将其添加到调查发现中还是将其丢弃。这有助于 CloudWatch 调查不断优化迭代,并排查问题的根本原因。CloudWatch 调查可以帮助您找到根本原因,而无需手动识别和查询多个指标和其他遥测和事件来源。原本需要花费数小时才能在不同控制台之间进行搜索和切换的故障排除问题,现在可以在更短的时间内得到解决。

  • 配置跨账户访问

    利用 CloudWatch 跨账户可观测性,让调查能从其他源账户收集数据。

  • 向调查添加新的遥测数据源

    添加 CloudTrail 事件历史记录中的数据,有助于 CloudWatch 调查功能将问题与更改事件关联起来。添加 X-Ray 可以改善拓扑和应用程序映射。您还可以添加来自 Application Signals 的数据,将该遥测数据与其他遥测数据源相结合,从而更深入地了解应用程序和服务的运行状况。如果您使用 Amazon EKS 集群,则可向 CloudWatch 调查功能提供 EKS 资源访问权限,以提供有关可能涉及所调查问题的集群资源的更详细信息。

  • 向调查发现添加备注或注释

    能够在报告或审计期间为调查发现提供额外的背景信息,以呈现更全面的视角。

  • 执行建议的运行手册补救措施

    CloudWatch 调查功能可能会建议您使用自动化运行手册尝试自动解决问题。自动化是 Systems Manager(另一项 AWS 服务)的一项功能。自动化运行手册定义了要在您选择的资源上运行的一系列步骤或操作。每个运行手册都旨在解决一个特定的问题。

  • 与团队成员共享调查结果

    无需进行额外配置,调查即可与登录用户的会话相关联。其他用户无法查看调查结果或继续调查。配置 CloudWatch 调查功能后,账户中所有已获得必要权限的用户都可以进行调查。

  • 手动结束、存档或重新打开调查

    在账户中配置 CloudWatch 调查功能之前,调查运行一次后即会完成。配置 CloudWatch 调查功能后,调查可以持续进行,直至问题解决。问题解决后,调查会存档。如果您已经解决了问题,但导致调查的条件仍然存在,则可以手动关闭调查。如果条件再次出现,您可以重新启动(或重新开始)调查。

  • 调查报告

    完成调查后,您可以生成一份全面的调查报告,该报告会自动捕获所有调查发现、时间线事件和建议措施。

配置 CloudWatch 调查功能后,将在账户中创建调查组。每个账户可以有一个调查组,该组中最多可同时有 2 项并发活动调查。每月,每个账户最多可以创建 150 项包含人工智能分析的增强型调查。调查组属于账户级别的配置。在账户中创建调查组后,该组将用于该账户中已启动的所有调查。

注意

配置 CloudWatch 调查功能后,CloudWatch 将使用提供的 IAM 角色定期扫描账户中的资源,实现资源与遥测数据的映射。对于某些与资源描述或资源列表相关的 API 调用,某些服务(例如 Lambda)会代表 CloudWatch 调用 KMS 解密 API。执行此后台进程的目的是确保拓扑结构反映账户及其依赖项的最新状态。无论是否有正在进行的调查,都会进行此刷新。