

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 模型监控器时间表和警报
<a name="model-dashboard-schedule"></a>

使用 Python SDK，您可以为数据质量、模型质量、偏差偏移或特征归因偏移创建 Model Monitor。有关使用 SageMaker 模型监视器的更多信息，请参阅[使用 Amazon 模型监视器监控数据和 SageMaker 模型质量](model-monitor.md)。模型控制面板会填充您在账户中所有模型上创建的所有监控器中的信息。您可以跟踪每台监控器的状态，状态可以指示监控器是按预期运行，还是由于内部错误而出现故障。您还可以在模型详细信息页面中激活或停用任何监控器。有关如何查看模型的计划监控器的说明，请参阅[查看计划监控器](model-dashboard-schedule-view.md)。有关如何激活或停用 Model Monitor 的说明，请参阅[激活或停用 Model Monitor](model-dashboard-schedule-activate.md)。

配置正确且正在运行的 Model Monitor 可能会发出警报，在这种情况下，监控执行会生成违规情况报告。有关警报如何工作以及如何查看警报结果、历史记录和用于调试的作业报告链接的详细信息，请参阅[查看和编辑警报](model-dashboard-alerts.md)。

# 查看计划监控器
<a name="model-dashboard-schedule-view"></a>

使用 SageMaker Model Monitor 持续监控您的机器学习模型是否存在数据偏差、模型质量、偏差和其他可能影响模型性能的问题。设置监控计划后，您可以通过 SageMaker AI 控制台查看这些预定监视器的详细信息。以下程序概述了访问和查看特定模型计划监控程序的步骤，包括其当前状态：

**查看模型的计划监控器**

1. 打开 A [SageMaker I 控制台](https://console.aws.amazon.com/sagemaker/)。

1. 在左侧面板中选择**治理**。

1. 选择**模型控制面板**。

1. 在模型控制面板的**模型**部分中，选择要查看的计划监控器的模型名称。

1. 在**监控计划**部分中查看计划监控器。您可以在**状态计划**列中查看每个监控器的状态，状态为以下值之一：
   + **失败**：由于配置或设置有问题（例如用户权限不正确），监控计划失败。
   + **待处理**：正在计划监控器。
   + **已停止**：计划已被用户停止。
   + **已计划**：计划已创建并按您指定的频率运行。

# 激活或停用 Model Monitor
<a name="model-dashboard-schedule-activate"></a>

使用以下步骤激活或停用模型监控器。

**要激活或停用 Model Monitor，请完成以下步骤：**

1. 打开 A [SageMaker I 控制台](https://console.aws.amazon.com/sagemaker/)。

1. 在左侧面板中选择**治理**。

1. 选择**模型控制面板**。

1. 在模型控制面板的**模型**部分，选择要修改的警报的模型名称。

1. 选中要修改的警报的监控计划旁边的单选框。

1. （可选）如果要停用监控计划，请选择**停用监控计划**。

1. （可选）如果要激活监控计划，请选择**激活监控计划**。

# 查看和编辑警报
<a name="model-dashboard-alerts"></a>

模型控制面板显示您在 Amazon 中配置的警报 CloudWatch。您可以直接在控制面板中修改警报条件。警报条件取决于两个参数：
+ **要对其发出警报的数据点**：在评估期内，有多少次执行失败会引发警报。
+ **评估期**：评估警报状态时要考虑的最近监控执行次数。

下图显示了一系列 Model Monitor 执行的示例场景，在该场景中，我们将假设的**评估期**设置为 3，将**要对其发出警报的数据点**值设置为 2。每次监控执行后，都会计算**评估期** 3 内的故障次数。如果失败次数达到或超过**要对其发出警报的数据点**值 2，则监控器会发出警报并保持警报状态，直到在随后的迭代中，**评估期**内的故障次数小于 2。在图像中，当监控器发出警报或保持警报状态时，评估窗口为红色，否则为绿色。

请注意，如图中前 2 行所示，即使评估窗口大小未达到**评估期** 3，但如果故障次数达到或超过**要对其发出警报的数据点**值 2，则监控器仍会发出警报。

![\[由七个示例监控执行组成的序列。\]](http://docs.aws.amazon.com/zh_cn/sagemaker/latest/dg/images/model_monitor/model-dashboard-alerts-window.png)


在监控器详细信息页面中，您可以查看警报历史记录，编辑现有警报条件，以及查看作业报告以帮助调试警报故障。有关如何查看监控执行失败的警报历史记录或作业报告的说明，请参阅[查看警报历史记录或作业报告](model-dashboard-alerts-view.md)。有关如何编辑警报条件的说明，请参阅[编辑警报条件](model-dashboard-alerts-edit.md)。

# 查看警报历史记录或作业报告
<a name="model-dashboard-alerts-view"></a>

**要查看执行失败的警报历史记录或作业报告，请完成以下步骤：**

1. 打开 A [SageMaker I 控制台](https://console.aws.amazon.com/sagemaker/)。

1. 在左侧面板中选择**治理**。

1. 选择**模型控制面板**。

1. 在模型控制面板的**模型**部分，选择要查看的警报历史记录的模型名称。

1. 在**计划名称**列中，选择要查看的警报历史记录的监控器名称。

1. 要查看警报历史记录，请选择**警报历史记录**选项卡。

1. （可选）要查看监控执行的作业报告，请完成以下步骤：

   1. 在**警报历史记录**选项卡中，为要调查的警报选择**查看执行**。

   1. 在**执行历史记录**表中，选择要调查的监控执行的**查看报告**。

**报告将显示以下信息：**
      + **特征**：监控的用户定义的机器学习特征
      + **约束**：监控器内的特定检查
      + **违规详细信息**：有关违反约束的原因的信息

# 编辑警报条件
<a name="model-dashboard-alerts-edit"></a>

**要在模型控制面板中编辑警报，请完成以下步骤：**

1. 打开 A [SageMaker I 控制台](https://console.aws.amazon.com/sagemaker/)。

1. 在左侧面板中选择**治理**。

1. 选择**模型控制面板**。

1. 在模型控制面板的**模型**部分，选择要修改的警报的模型名称。

1. 选中要修改的警报的监控计划旁边的单选框。

1. 在**监控计划**部分中选择**编辑警报**。

1. （可选）如果要更改**评估期**内触发警报的故障次数，请更改**要对其发出警报的数据点**。

1. （可选）如果要更改评估警报状态时要考虑的最近监控执行次数，请更改**评估期**。