本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
最佳实践
了解最小日期范围
至少使用 14 天作为训练数据持续时间。但是,在许多情况下,我们建议您包含更长时间的数据。
确保您的训练数据集跨越资产在其所有正常运行模式下运行的时间段。这种方法有助于 AWS IoT SiteWise 准确区分预期行为和真实异常。
如果您的训练数据不能代表所有典型的操作模式,则 AWS IoT SiteWise 可能会错误地将不熟悉但正常的模式标记为异常,从而增加误报。
高频数据采样以及训练和推理之间的一致性
如果您的传感器生成数据的频率高于 1 Hz(每秒读数超过一次),请在训练期间应用采样。采样可以减少数据量,同时保留基本趋势,从而实现高效处理,并通过最大限度地减少噪声或瞬态波动的影响来改善模型概括。
AWS IoT SiteWise 原生异常检测目前不支持以低于 1 Hz 的速率摄取的数据。在配置异常检测之前,请验证您的数据是否满足此最低频率要求。
此外,还可以 AWS IoT SiteWise 使用您在训练期间配置的采样率进行推理。为保持一致性并确保异常检测结果准确,请选择与您的操作需求和传感器数据行为相一致的采样率。
有关如何设置采样率的更多详细信息,请访问采样率配置。
标签建议
对异常进行准确、一致的标注对于有效的模型评估和持续改进至关重要。标记异常时,请考虑以下最佳实践:
-
整合相关的异常:如果密切发生的异常属于同一个潜在问题,则不要将它们标记为单独的事件。例如,如果异常发生在 1-2 天内,并且驱动它们的根本原因相同,则将其视为单个异常窗口。这种方法可以帮助模型更好地了解异常行为的模式,并减少评估数据中的噪音。
-
标记异常窗口,而不仅仅是点:与其将单个数据点标记为异常,不如将反映从偏差开始到恢复的异常行为的整个窗口进行标记。这种方法提供了更清晰的界限,并改善了模型与实际操作问题的一致性。
-
排除不确定的时期:如果您不确定某个时期是否异常,请将其置于未标记状态。模棱两可的标签会混淆模型并随着时间的推移降低其准确性。
有关如何添加标签的更多详细信息,请访问给你的数据加标签。