本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
最佳實務
了解最小日期範圍
訓練資料持續時間至少使用 14 天。不過,我們建議您在許多情況下包含較長的資料期間。
確保您的訓練資料集跨越了資產在所有正常操作模式下操作的時間範圍。此方法有助於 AWS IoT SiteWise 準確區分預期行為和真正的異常。
如果您的訓練資料不代表所有典型的操作模式, AWS IoT SiteWise 可能會不正確地將不熟悉但正常的模式標記為異常,這會增加誤報。
對訓練和推論之間的高頻率資料和一致性進行抽樣
如果您的感應器以高於 1 Hz 的頻率產生資料 (每秒超過一個讀數),請在訓練期間套用取樣。取樣可降低資料量,同時保留基本趨勢,進而實現高效率的處理,並透過將雜訊或暫時性波動的影響降至最低來改善模型一般化。
AWS IoT SiteWise 原生異構體偵測目前不支援以低於 1 Hz 的速率擷取資料。在設定異常偵測之前,請確認您的資料符合此最低頻率要求。
此外, 也會 AWS IoT SiteWise 使用您在訓練期間為推論設定的取樣率。為了保持一致性並確保準確的異常偵測結果,請選擇符合您操作需求和感應器資料行為的取樣率。
尋找如何在 設定取樣率的詳細資訊取樣率組態。
標籤建議
準確且一致的異常標記對於有效模型評估和持續改進至關重要。當您標記異常時,請考慮下列最佳實務:
-
合併相關的異常:如果密切發生的異常屬於相同的基礎問題,請勿將其標記為單獨的事件。例如,如果異常在彼此的 1-2 天內發生,且相同的根本原因驅動它們,請將它們視為單一異常時段。這種方法有助於模型更好地學習異常行為模式,並減少評估資料中的雜訊。
-
標記異常時段,而不只是點:不要將個別資料點標記為異常,而是標記反映從偏差開始到復原的異常行為的整個時段。此方法提供更清晰的界限,並改善模型與實際操作問題的一致性。
-
排除不確定的期間:如果您不確定期間是否異常,請保留未標記的期間。模棱兩可的標籤可能會混淆模型,並隨著時間降低其準確性。
尋找如何在 新增標籤的詳細資訊標記您的資料。