本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
進階訓練組態
取樣率組態
取樣率會定義記錄感應器讀數的頻率 (例如,每秒一次,或每分鐘一次)。此設定會直接影響訓練資料的精細程度,並影響模型擷取感應器行為中短期變化的能力。
請造訪 對訓練和推論之間的高頻率資料和一致性進行抽樣 以了解最佳實務。
設定目標取樣率
您可以選擇性地在訓練組態TargetSamplingRate
中指定 ,以控制資料取樣的頻率。支援的值如下:
PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
這些是 ISO 8601 持續時間格式,代表下列時間格式:
-
PT1S
= 1 秒 -
PT1M
= 1 分鐘 -
PT1H
= 1 小時
選擇在資料解析和訓練效率之間取得適當平衡的取樣率。提供下列費率:
-
較高的取樣率 (
PT1S
) 提供更精細的詳細資訊,但可能會增加資料量和訓練時間。 -
取樣率較低 (
PT10M
、PT1H
) 可減少資料大小和成本,但可能會錯過短期異常。
處理時間戳記不一致
AWS IoT SiteWise 在訓練期間, 會自動補償多個資料串流之間的時間戳記不一致。這可確保一致的模型行為,即使輸入訊號未及時完全對齊。
請造訪 對訓練和推論之間的高頻率資料和一致性進行抽樣 以了解最佳實務。
啟用取樣
將下列程式碼新增至 anomaly-detection-training-payload.json
。
透過在訓練動作承載TargetSamplingRate
中新增 來設定取樣,並使用資料的取樣率。允許的值為:PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
。
{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "targetSamplingRate": "TargetSamplingRate" }
範例 取樣率組態的 :
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "targetSamplingRate": "PT1M" }
標記您的資料
標記資料時,您必須定義代表異常設備行為期間的時間間隔。此標籤資訊以 CSV
檔案的形式提供,其中每一列都會指定設備未正常運作的時間範圍。
每一列包含兩個時間戳記:
-
開始時間,指出認為異常行為何時開始。
-
結束時間,代表第一次觀察到失敗或問題的時間。
此 CSV 檔案存放在 Amazon S3 儲存貯體中,並在模型訓練期間使用,以協助系統從已知的異常行為範例學習。下列範例顯示標籤資料應如何顯示為 .csv
檔案。檔案沒有標頭。
範例 CSV 檔案的 :
2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000 2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000 2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000
第 1 列代表 2024 年 6 月 21 日的維護事件,有 12 小時的時段 (從 2024-06-21T00:00:00.000000Z
到 2024-06-21T12:00:00.000000Z
) AWS IoT SiteWise 供 尋找異常行為。
第 2 列代表 2024 年 7 月 11 日的維護事件,有 12 小時的時段 (從 2024-07-11T00:00:00.000000Z
到 2024-07-11T12:00:00.000000Z
) AWS IoT SiteWise 供 尋找異常行為。
第 3 列代表 2024 年 7 月 31 日的維護事件,有 12 小時的時段 (從 2024-07-31T00:00:00.000000Z
到 2024-07-31T12:00:00.000000Z
) AWS IoT SiteWise 供 尋找異常行為。
AWS IoT SiteWise 會使用所有這些時段來訓練和評估模型,以識別這些事件的異常行為。請注意,並非所有事件都是可偵測的,而且結果高度取決於基礎資料的品質和特性。
如需抽樣最佳實務的詳細資訊,請參閱 最佳實務。
資料標記步驟
-
根據標記資料先決條件中的標記先決條件來設定 Amazon S3 儲存貯體。
-
將檔案上傳至您的標籤儲存貯體。
-
將下列項目新增至
anomaly-detection-training-payload.json
。-
在 檔案的
labelInputConfiguration
區段中提供位置。labels-bucket
將 取代為儲存貯體名稱,並將 取代files-prefix
為 file(s) 路徑或任何部分的字首。位置中的所有檔案都會進行剖析,並 (成功時) 用作標籤檔案。
-
{ "exportDataStartTime":
StartTime
, "exportDataEndTime":EndTime
, "labelInputConfiguration": { "bucketName": "label-bucket
", "prefix": "files-prefix
" } }
範例 標籤組態的 :
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "labelInputConfiguration": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv" } }
評估模型
AWS IoT SiteWise 訓練模型的指標模型診斷是在個別事件中評估模型效能。在訓練期間, 會為輸入資料集中的每一列 AWS IoT SiteWise 產生異常分數和感應器貢獻診斷。較高的異常分數表示發生異常事件的可能性較高。
當您使用 ExecuteAction API 和AWS/ANOMALY_DETECTION_TRAINING
動作類型訓練模型時,可以使用 Pointwise 診斷。
若要設定模型評估,
-
根據標記資料先決條件中的標記先決條件來設定 Amazon S3 儲存貯體。
-
將下列項目新增至
anomaly-detection-training-payload.json
。-
針對用於評估模型效能的視窗中的資料,提供
evaluationStartTime
和evaluationEndTime
(兩者皆以 epoch 秒為單位)。 -
提供 Amazon S3 儲存貯體位置 (
resultDestination
),以便將評估診斷寫入其中。
-
注意
模型評估間隔 (dataStartTime
到 dataEndtime
) 必須重疊或連續於訓練間隔。不允許任何差距。
{ "exportDataStartTime":
StartTime
, "exportDataEndTime":EndTime
, "modelEvaluationConfiguration": { "dataStartTime":evaluationStartTime
, "dataEndTime":evaluationEndTime
"resultDestination": { "bucketName": "s3BucketName
", "prefix": "bucketPrefix
" } } }
範例 模型評估組態的 :
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "modelEvaluationConfiguration": { "dataStartTime": 1722789360, "dataEndTime": 1725174000, "resultDestination": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl" } } }