Configurazioni di allenamento avanzate - AWS IoT SiteWise

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configurazioni di allenamento avanzate

configurazione della frequenza di campionamento

La frequenza di campionamento definisce la frequenza con cui vengono registrate le letture del sensore (ad esempio, una volta al secondo o una volta al minuto). Questa impostazione influisce direttamente sulla granularità dei dati di addestramento e influenza la capacità del modello di rilevare variazioni a breve termine nel comportamento del sensore.

Visita la pagina Campionamento per dati ad alta frequenza e coerenza tra addestramento e inferenza per scoprire le migliori pratiche.

Configura la frequenza di campionamento target

Facoltativamente, puoi specificare un TargetSamplingRate nella configurazione di allenamento, per controllare la frequenza con cui vengono campionati i dati. I valori supportati sono:

PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H

Si tratta di formati di durata ISO 8601, che rappresentano i seguenti formati temporali:

  • PT1S= 1 secondo

  • PT1M= 1 minuto

  • PT1H= 1 ora

Scegliete una frequenza di campionamento che rappresenti il giusto equilibrio tra risoluzione dei dati ed efficienza dell'allenamento. Sono disponibili le seguenti tariffe:

  • Frequenze di campionamento più elevate (PT1S) offrono dettagli più precisi, ma possono aumentare il volume dei dati e il tempo di formazione.

  • Frequenze di campionamento più basse (PT10M,PT1H) riducono le dimensioni e i costi dei dati, ma possono non rilevare anomalie di breve durata.

Gestione del disallineamento del timestamp

AWS IoT SiteWise compensa automaticamente il disallineamento del timestamp su più flussi di dati durante l'allenamento. Ciò garantisce un comportamento coerente del modello anche se i segnali di ingresso non sono perfettamente allineati nel tempo.

Visita Campionamento per dati ad alta frequenza e coerenza tra addestramento e inferenza la pagina per scoprire le migliori pratiche.

Abilita il campionamento

Aggiungere il codice seguente a. anomaly-detection-training-payload.json

Configura il campionamento aggiungendo TargetSamplingRate il payload dell'azione di formazione, con la frequenza di campionamento dei dati. I valori consentiti sono:. PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "targetSamplingRate": "TargetSamplingRate" }
Esempio di una configurazione della frequenza di campionamento:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "targetSamplingRate": "PT1M" }

Etichetta i tuoi dati

Quando si etichettano i dati, è necessario definire intervalli di tempo che rappresentino periodi di comportamento anomalo delle apparecchiature. Queste informazioni di etichettatura vengono fornite come CSV file, in cui ogni riga specifica un intervallo di tempo durante il quale l'apparecchiatura non funzionava correttamente.

Ogni riga contiene due timestamp:

  • L'ora di inizio, che indica quando si ritiene che sia iniziato un comportamento anomalo.

  • L'ora di fine, che rappresenta la data in cui l'errore o il problema sono stati rilevati per la prima volta.

Questo file CSV è archiviato in un bucket Amazon S3 e viene utilizzato durante la formazione dei modelli per aiutare il sistema a imparare da esempi noti di comportamento anomalo. L'esempio seguente mostra come i dati dell'etichetta devono apparire come file. .csv Il file non ha un'intestazione.

Esempio di un file CSV:
2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000 2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000 2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000

La riga 1 rappresenta un evento di manutenzione il 21 giugno 2024, con una finestra di 12 ore (dal 2024-06-21T00:00:00.000000Z al2024-06-21T12:00:00.000000Z) per individuare eventuali comportamenti AWS IoT SiteWise anomali.

La riga 2 rappresenta un evento di manutenzione l'11 luglio 2024, con una finestra di 12 ore (dal 2024-07-11T00:00:00.000000Z al2024-07-11T12:00:00.000000Z) per AWS IoT SiteWise cercare comportamenti anomali.

La riga 3 rappresenta un evento di manutenzione il 31 luglio 2024, con una finestra di 12 ore (dal 2024-07-31T00:00:00.000000Z al2024-07-31T12:00:00.000000Z) per AWS IoT SiteWise cercare comportamenti anomali.

AWS IoT SiteWise utilizza tutte queste finestre temporali per addestrare e valutare modelli in grado di identificare comportamenti anomali in relazione a questi eventi. Tieni presente che non tutti gli eventi sono rilevabili e i risultati dipendono in larga misura dalla qualità e dalle caratteristiche dei dati sottostanti.

Per informazioni dettagliate sulle migliori pratiche per il campionamento, vedere. Best practice

Fasi di etichettatura dei dati

  • Configura il tuo bucket Amazon S3 in base ai prerequisiti di etichettatura in Labeling data prerequisites.

  • Carica il file nel tuo bucket di etichettatura.

  • Aggiungi quanto segue a. anomaly-detection-training-payload.json

    • Specificate le posizioni nella labelInputConfiguration sezione del file. Sostituisci labels-bucket con il nome del bucket e files-prefix con il percorso dei file o qualsiasi parte del prefisso. Tutti i file presenti nella posizione vengono analizzati e (in caso di successo) utilizzati come file di etichette.

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "labelInputConfiguration": { "bucketName": "label-bucket", "prefix": "files-prefix" } }
Esempio di una configurazione di etichetta:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "labelInputConfiguration": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv" } }

Valutazione del modello

La diagnostica puntuale del modello per un modello di AWS IoT SiteWise allenamento è una valutazione delle prestazioni del modello in occasione di singoli eventi. Durante l'addestramento, AWS IoT SiteWise genera un punteggio di anomalia e esegue una diagnostica del contributo dei sensori per ogni riga del set di dati di input. Un punteggio di anomalia più elevato indica una maggiore probabilità di un evento anomalo.

La diagnostica puntuale è disponibile quando si addestra un modello con ExecuteActionAPI e il tipo di azione. AWS/ANOMALY_DETECTION_TRAINING

Per configurare la valutazione del modello,

Nota

L'intervallo di valutazione del modello (dataStartTimetodataEndtime) deve sovrapporsi o essere contiguo all'intervallo di addestramento. Non sono consentiti spazi vuoti.

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "modelEvaluationConfiguration": { "dataStartTime": evaluationStartTime, "dataEndTime": evaluationEndTime "resultDestination": { "bucketName": "s3BucketName", "prefix": "bucketPrefix" } } }
Esempio di una configurazione di valutazione del modello:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "modelEvaluationConfiguration": { "dataStartTime": 1722789360, "dataEndTime": 1725174000, "resultDestination": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl" } } }