

# 调查您环境中的操作问题
<a name="Investigations-Investigate"></a>

您可以根据工作流和所调查问题的来源，通过多种方式创建调查。调查启动后，您就可以查看人工智能生成的建议，接受或丢弃调查发现，并通过自动化运行手册采取补救措施。

以下过程说明了如何从不同入口点开始调查，以及如何使用活动调查：

**Contents**
+ [创建调查](Investigations-CreateInvestigation.md)
  + [通过 Amazon Q 聊天创建调查](Investigations-CreateInvestigation.md#Investigations-CreateInvestigation-QChat)
  + [通过 CloudWatch 警报操作创建调查](Investigations-CreateInvestigation.md#Investigations-CreateInvestigation-AlarmAction)
+ [从 CloudWatch Application Signals 服务级别目标（SLO）创建调查](Investigations-CreateInvestigation-SLO.md)
+ [查看并继续公开调查](Investigations-Continue.md)
+ [为 CloudWatch 调查查看并执行建议的运行手册补救措施](suggested-investigation-actions.md)
+ [管理您当前的调查](Investigations-Manage.md)
+ [重新开始已存档的调查](Investigations-Restart.md)

# 创建调查
<a name="Investigations-CreateInvestigation"></a>

您可以从多个 AWS 控制台开始调查，包括（但不限于）CloudWatch 警报页面、CloudWatch 指标页面和 Lambda 监控页面。

**从 AWS 控制台页面开始调查**

1. 在**账户级别**，选择要调查的指标，或是警报对应的图表。

1. 如果页面顶部有**调查**按钮，请选择该按钮，然后选择**开始新调查**。

   否则，请选择该指标的垂直省略号菜单图标 ![\[Depicts the appearance of the vertical ellipsis icon on the console\]](http://docs.aws.amazon.com/zh_cn/AmazonCloudWatch/latest/monitoring/images/vmore.png)，然后选择**调查**，**开始新调查**。

1. 在**调查**窗格中，在**新调查标题**中输入调查的名称，也可以输入有关所选指标或警报的注释。

1. 在**近似影响开始时间**下，CloudWatch 调查功能会根据所选遥测数据建议需排查的时间戳。要修改调查时间戳，更新日期与时间即可。

1. 然后选择**开始调查**。

   调查开始。CloudWatch 调查 会扫描您的遥测数据，查找可能与这种情况相关的数据。

1. 要将调查数据移到较大的窗格中，请选择**以整页形式打开**。

1. 有关在继续调查时可以采取的步骤的详细说明，请参阅 [查看并继续公开调查](Investigations-Continue.md)。

## 通过 Amazon Q 聊天创建调查
<a name="Investigations-CreateInvestigation-QChat"></a>

CloudWatch 调查聊天中，您可在询问涉及部署中出现的问题。问题可能是“为什么我的 Lambda 函数今天很慢？”

当您这样做时，CloudWatch 调查可能会询问后续问题并对问题进行运行状况检查。运行状况检查后，聊天将提示您是否要开始调查。

有关更多信息和更多示例问题，请参阅 [Chatting with Amazon Q about AWS](https://docs.aws.amazon.com/amazonq/latest/qdeveloper-ug/chat-with-q.html#example-questions-investigations)。

有关在调查开始后继续调查时可以采取的步骤的详细说明，请参阅 [查看并继续公开调查](Investigations-Continue.md)。

## 通过 CloudWatch 警报操作创建调查
<a name="Investigations-CreateInvestigation-AlarmAction"></a>

创建 CloudWatch 警报后，可以指定在进入“警报”状态时自动开始调查。您可以对指标警报和复合警报执行此操作。有关更多信息，请参阅[从警报启动 CloudWatch 调查](Start-Investigation-Alarm.md)、[根据静态阈值创建 CloudWatch 告警](ConsoleAlarms.md)和[创建复合告警](Create_Composite_Alarm.md)。

# 从 CloudWatch Application Signals 服务级别目标（SLO）创建调查
<a name="Investigations-CreateInvestigation-SLO"></a>

您可以从 CloudWatch Application Signals 服务级别目标（SLO）指标启动调查。

**从 CloudWatch Application Signals 服务级别目标（SLO）启动调查**

1. 通过 [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/) 打开 CloudWatch 控制台。

1. 导航到**Applications Signals（APM）**、**服务级别目标（SLO）**控制台页面。

1. 从**服务级别目标（SLO）**列表中选择一个条目以显示该 SLO 的可用指标。

1. 选择一个指标，然后在**操作**菜单中选择**调查**。

   或者，在要调查的指标的可视化中，在更多 ![\[Vertical ellipsis used to display more options.\]](http://docs.aws.amazon.com/zh_cn/AmazonCloudWatch/latest/monitoring/images/vmore.png) 菜单旁边，选择人工智能 ![\[Icon used to represent a feature that uses artificial intelligence .\]](http://docs.aws.amazon.com/zh_cn/AmazonCloudWatch/latest/monitoring/images/cw-ai-icon.png) 图标以启动调查。
**注意**  
如果您尚未在账户中配置操作调查，人工智能图标将打开**操作疑难解答**窗格。选择**开始**以配置调查组，然后继续。

1. 在**调查**的**操作疑难解答**窗格中，在**调查标题**中输入调查的名称，也可以输入有关所选指标的注释。

1. 在**近似影响开始时间**下，CloudWatch 调查功能会根据所选遥测数据建议需排查的时间戳。要修改调查时间戳，更新日期与时间即可。

1. 然后选择**开始调查**。

   调查开始。CloudWatch 调查 会扫描您的遥测数据，查找可能与这种情况相关的数据。

1. 要将调查数据移到较大的窗格中，请选择**以整页形式打开**。

1. 有关在继续调查时可以采取的步骤的详细说明，请参阅 [查看并继续公开调查](Investigations-Continue.md)。

# 查看并继续公开调查
<a name="Investigations-Continue"></a>

使用本节中的步骤查看并继续现有调查

**查看并继续调查**

1. 如果您尚未进入调查页面，请执行以下操作：

   1. 通过 [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/) 打开 CloudWatch 控制台。

   1. 在左侧导航窗格中，依次选择 **AI 操作**、**调查**。

   1. 选择调查的名称。

1. **源**部分显示已添加到调查发现中的项目，包括最初选择用来开始调查的指标或警报。

   右侧的窗格包括选项卡。选择**建议**选项卡。

1. **建议**选项卡显示 CloudWatch 调查发现的可能与调查相关的其他遥测的*观测结果*。还可能包括*假设*，这些假设是 CloudWatch 调查发现的这种情况的可能原因或根本原因。

   CloudWatch 调查会以自然语言形式同时编写观测结果和假设。

   您有多种选择：
   + 对于每个建议，您可以选择**接受**或**丢弃**。

     当您选择**接受**时，建议将添加到**源**部分，CloudWatch 调查将使用此信息指导进一步的扫描和建议。

     如果您选择**丢弃**，则建议将移至**已丢弃**选项卡。
   + 对于每个观测结果类型的建议，您可以选择在**建议**选项卡中展开图表，或者在 CloudWatch 控制台中将其打开以查看其更多详细信息。
   + 其中一些观测结果可能是 CloudWatch 调查在调查中运行的 CloudWatch Logs Insights 查询的结果。当观测结果是 CloudWatch Logs Insights 查询结果时，查询本身将显示为观测结果的一部分。您可以编辑查询并重新运行。为此，请选择结果旁边的垂直省略号菜单图标 ![\[An example of a CloudWatch overview home page, showing alarms and their current state, and examples of other metrics graph widgets that might appear on the overview home page.\]](http://docs.aws.amazon.com/zh_cn/AmazonCloudWatch/latest/monitoring/images/vmore.png)，然后选择**在 Logs Insights 中打开**。有关更多信息，请参阅[使用 CloudWatch Logs Insights 分析日志数据](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html)。
   + 如果您知道某项 AWS 服务中的遥测可能适用于此调查，则可以访问该服务的控制台，将遥测添加到调查中。例如，要向调查中添加 Lambda 指标，可以执行下列操作：

     1. 打开 Lambda 控制台。

     1. 在**监控**部分中，找到该指标。

     1. 打开指标的垂直省略号上下文菜单 ![\[An example of a CloudWatch overview home page, showing alarms and their current state, and examples of other metrics graph widgets that might appear on the overview home page.\]](http://docs.aws.amazon.com/zh_cn/AmazonCloudWatch/latest/monitoring/images/vmore.png)，依次选择**调查**、**添加到调查**，然后在**调查**窗格中选择调查的名称。
   + 当您在**建议**选项卡中查看假设时，可以选择**显示推理**来显示 CloudWatch 调查用于生成假设的数据。对于涉及多个资源的假设分析，您可能还会看到一张可视化图表，该图表将资源间的因果关系以“相互连接的节点”形式呈现。
   + 您可以选择**已丢弃**选项卡并查看之前已丢弃的建议。要将其中一个添加到调查发现中，请选择**还原到调查发现**。
   + 要为调查发现添加注释，请在**源**窗格中选择**新建注释**。然后输入您的注释并选择**添加**。

1. 当您向**源**区域添加假设时，可能会显示**显示建议的操作**。如果是，则选择此选项会显示您可以执行的可能操作，前提是该问题假设是正确的。可能的操作包括：
   + **文档建议**是指向 AWS 文档的链接，可以帮助您了解正在处理的问题以及如何解决该问题。要查看建议的文档，请选择其**查看**链接
   + **运行手册建议**是利用 Systems Manager Automation 中预定义的*运行手册*的建议。每个运行手册都定义了在 AWS 资源上执行任务的许多步骤。有关继续执行运行手册操作的信息，请参阅[为 CloudWatch 调查查看并执行建议的运行手册补救措施](suggested-investigation-actions.md)。
**重要**  
执行自动化运行手册需要付费。但是，CloudWatch 调查可让您预览建议的运行手册所执行的操作，从而使您有机会更好地评估是否执行运行手册。有关自动化定价的信息，请参阅 [AWS Systems Manager 的自动化定价](https://aws.amazon.com/systems-manager/pricing/#Automation)。

1. （可选）选择**事件报告**以创建全面的事件分析文档。有关更多信息，请参阅 [生成事件报告](Investigations-Incident-Reports.md)。

1. 当您准备结束调查时，请选择**结束调查**，然后选择性地添加最终注释。调查状态更改为**已存档**。您可以通过打开调查页面并选择**重新开始调查**来重新开始已存档的调查。

**注意**  
某些时候，您可能会看到**分析已完成。调查已结束**显示在**源**区域上方。如果您随后向调查发现添加更多遥测数据，则此消息会发生变化，CloudWatch 调查会根据您添加到调查发现中的新数据重新开始扫描您的遥测数据。

# 为 CloudWatch 调查查看并执行建议的运行手册补救措施
<a name="suggested-investigation-actions"></a>

当您向活动调查的**源**区域添加假设时，CloudWatch 调查可能会显示**显示建议的操作**。一个建议的操作可能是查看文档，其中包含可帮助您手动修复问题的信息。

另一个建议可能是使用*自动化运行手册*尝试自动解决问题。自动化是 Systems Manager（另一项 AWS 服务）中的一项功能。自动化运行手册定义了要在您选择的资源上运行的一系列步骤或操作。每个运行手册都旨在解决一个特定的问题。运行手册可以满足各种操作需求：创建、维修、重新配置、安装、故障排除、修复、复制等。有关自动化的更多信息，请参阅 [与 AWS Systems Manager Automation 集成](Investigations-Integrations.md#Investigations-Integrations-SSM)。

**开始前的准备工作**  
在调查中使用自动化运行手册之前，请注意以下重要事项：
+ 选择执行运行手册会产生费用。有关更多信息，请参阅 [AWS Systems Manager 定价](https://aws.amazon.com/systems-manager/pricing/#Automation)。
+ 根本原因和运行手册建议由自动推理和生成式人工智能服务提供支持。
**重要**  
您对执行运行手册步骤所产生的操作以及选择在运行手册执行期间输入的参数值负责。您可能需要编辑建议的运行手册，进而确保运行手册按预期运行。有关更多信息，请参阅《[AWS 负责任的 AI 政策](https://aws.amazon.com/ai/responsible-ai/policy/)》****。
+ 根据运行手册的不同，您可能需要在运行手册的**输入参数**中输入值，然后才能运行执行。
+ 运行手册使用分配给操作员的 IAM 权限执行。如有必要，请使用不同的 IAM 权限登录，执行运行手册。除了正在执行的操作的权限外，您还需要其他 Systems Manager 权限才能执行运行手册步骤。有关更多信息，请参阅《AWS Systems Manager 用户指南》**中的[设置自动化](https://docs.aws.amazon.com//systems-manager/latest/userguide/automation-setup.html)。

**审核并执行针对 CloudWatch 调查的建议运行手册操作**

1. 要查看有关建议运行手册的信息，请选择**审核**获取有关如何执行运行手册步骤的信息。

   在调查详细信息页面上，选择**建议**。

1. 在**建议**窗格中，根据系统对所调查问题的分析，审核假设列表。

   对于每个假设，您可以选择以下选项：
   + **显示推理** – 查看有关系统为何生成假设的更多信息。
   + **查看操作** – 查看问题的建议操作。并非所有假设都将包括建议的操作。
   + **接受** – 接受假设并将其添加到调查的**源**部分。
**注意**  
接受假设并不会自动运行关联的运行手册解决方案。在接受假设之前，您可以查看建议的运行手册，但必须接受该假设才能执行运行手册。
   + **丢弃** – 拒绝假设，不再使用。

1. 选择**查看操作**后，在**建议的操作**窗格中，查看为解决该问题可以采取的建议操作列表。建议的操作可能包括以下一项或多项：
   + **AWS 知识文章** – 提供有关手动解决问题可以采取的步骤的信息，以及指向更多信息的链接。
   + **AWS 文档** – 提供指向与问题相关的用户文档主题的链接。
   + **AWS 拥有的运行手册** – 列出一个或多个由 AWS 管理的自动化运行手册，您可以运行这些运行手册来尝试解决问题。
   + **您拥有的运行手册** – 列出由您或您的账户或组织中的其他人创建的一个或多个自定义自动化运行手册，您可以运行这些运行手册来尝试解决问题。
**注意**  
系统通过评估自定义运行手册中的关键字，然后将其与正在调查的问题相关的术语进行比较，自动生成此运行手册列表。  
更多的关键字匹配意味着特定的自定义运行手册在**您拥有的运行手册**列表中出现的位置更高。

1. 审核假设后，您可以进一步检查建议的具体操作并通过选择**了解更多**阅读相关文档。您也可以选择**审核详细信息**来检查 AWS 和您拥有的建议运行手册。

1. 选择**审核运行手册的详细信息**时，请执行以下操作：

   1. 对于**运行手册描述**，请审核内容，其中概述了运行手册为修复正在调查的问题可以采取的措施。选择**查看步骤**，可视化运行手册的工作流程并深入了解各个步骤的详细信息。

   1. 对于**输入参数**，请为运行手册要求的任何参数指定值。这些参数因运行手册而异。

   1. 对于**执行预览**，请仔细审核信息。此信息说明了当您选择执行运行手册时的范围和影响。

      **执行预览**内容提供以下信息：
      + 运行手册操作将在多少个账户和区域中发生。
      + 将要采取的操作类型以及每种类型的数量。

        操作类型包括：
        + `Mutating`：运行手册步骤将通过创建、修改或删除资源的操作对目标进行更改。
        + `Non-Mutating`：运行手册步骤将检索有关资源的数据，但是不对其进行更改。此类别通常包括 `Describe`、`List`、`Get` 和类似的只读 API 操作。
        + `Undetermined`：未确定的步骤将调用由另一个编排服务运行的执行，如 AWS Lambda、AWS Step Functions 或 Run Command（AWS Systems Manager 的一项功能）。未确定的步骤可能还会调用第三方 API 或者运行 Python 或 PowerShell 脚本。Systems Manager Automation 无法检测到编排流程或第三方 API 执行的结果，所以无法对其进行评估。必须手动审查这些步骤的结果以确定其影响。

        有关支持的操作及其影响类型的信息，请参阅《AWS Systems Manager 用户指南》**中的[运行手册操作的修复影响类型](https://docs.aws.amazon.com/systems-manager/latest/userguide/remediation-impact-type.html)。

   1. 请仔细查看预览信息，然后再决定是否继续。

      此时，您可以选择以下操作之一：
      + 停止，不要执行运行手册。
      + 在执行运行手册之前更改输入参数。
      + 使用您已经选择的选项执行运行手册。
**重要**  
选择执行运行手册会产生费用。有关更多信息，请参阅 [AWS Systems Manager 定价](https://aws.amazon.com/systems-manager/pricing/#Automation)。

1. 如果要执行运行手册，请选择**执行**。

   如果您已经接受了该假设，则执行将运行。

   如果您尚未接受该假设，则在执行运行之前，会出现一个对话框提示您接受该假设。

为运行手册选择**执行**后，该操作将添加到调查的**源**窗格中。通过调查，您可以监控调查发现中指标中的新数据，以查看运行手册操作是否正在纠正问题。

# 管理您当前的调查
<a name="Investigations-Manage"></a>

您可以查看当前调查的列表、结束正在进行的调查、重新打开存档的调查、重命名和删除调查。您可以对个别调查执行这些操作，也可以批量执行这些操作。

**管理您当前的调查**

1. 通过 [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/) 打开 CloudWatch 控制台。

1. 在左侧导航窗格中，依次选择 **AI 操作**、**调查**。

1. （可选）按名称或调查状态筛选列表中显示的调查。

1. 选中要对其执行操作的一个或多个调查的复选框。

1. 选择**结束调查**，**重命名**或**删除**。

   系统将提示您确认操作或输入新的调查标题。

# 重新开始已存档的调查
<a name="Investigations-Restart"></a>

您可以重新开始已存档的调查。

**重新开始已存档的调查**

1. 通过 [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/) 打开 CloudWatch 控制台。

1. 在左侧导航窗格中，依次选择 **AI 操作**、**调查**。

1. 选择已存档调查的名称。

1. 选择**重新开始调查**。

1. （可选）更新事件报告。

   原始调查生成的任何事件报告仍可在调查历史记录中查看。您可以从调查详细信息页面访问这些报告。如果重新启动的调查发现了更多事实，则可以按照以下步骤重新生成事件报告：

   1. 选择**事件报告**，根据新的或更新的事实重新生成事件报告。

   1. 在**事件报告**页面上，查看更新的事实。

   1. 选择**重新生成**以更新事件报告。如果禁用**重新生成**按钮，则将不会发现任何新的事实。

   我们建议您不要无限期地将调查置于打开状态，因为只要调查处于打开状态，与调查相关的警报状态转换就会一直添加到调查中。