Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Configurazioni di allenamento avanzate
configurazione della frequenza di campionamento
La frequenza di campionamento definisce la frequenza con cui vengono registrate le letture del sensore (ad esempio, una volta al secondo o una volta al minuto). Questa impostazione influisce direttamente sulla granularità dei dati di addestramento e influenza la capacità del modello di rilevare variazioni a breve termine nel comportamento del sensore.
Visita la pagina Campionamento per dati ad alta frequenza e coerenza tra addestramento e inferenza per scoprire le migliori pratiche.
Configura la frequenza di campionamento target
Facoltativamente, puoi specificare un TargetSamplingRate
nella configurazione di allenamento, per controllare la frequenza con cui vengono campionati i dati. I valori supportati sono:
PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
Si tratta di formati di durata ISO 8601, che rappresentano i seguenti formati temporali:
-
PT1S
= 1 secondo -
PT1M
= 1 minuto -
PT1H
= 1 ora
Scegliete una frequenza di campionamento che rappresenti il giusto equilibrio tra risoluzione dei dati ed efficienza dell'allenamento. Sono disponibili le seguenti tariffe:
-
Frequenze di campionamento più elevate (
PT1S
) offrono dettagli più precisi, ma possono aumentare il volume dei dati e il tempo di formazione. -
Frequenze di campionamento più basse (
PT10M
,PT1H
) riducono le dimensioni e i costi dei dati, ma possono non rilevare anomalie di breve durata.
Gestione del disallineamento del timestamp
AWS IoT SiteWise compensa automaticamente il disallineamento del timestamp su più flussi di dati durante l'allenamento. Ciò garantisce un comportamento coerente del modello anche se i segnali di ingresso non sono perfettamente allineati nel tempo.
Visita Campionamento per dati ad alta frequenza e coerenza tra addestramento e inferenza la pagina per scoprire le migliori pratiche.
Abilita il campionamento
Aggiungere il codice seguente a. anomaly-detection-training-payload.json
Configura il campionamento aggiungendo TargetSamplingRate
il payload dell'azione di formazione, con la frequenza di campionamento dei dati. I valori consentiti sono:. PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "targetSamplingRate": "TargetSamplingRate" }
Esempio di una configurazione della frequenza di campionamento:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "targetSamplingRate": "PT1M" }
Etichetta i tuoi dati
Quando si etichettano i dati, è necessario definire intervalli di tempo che rappresentino periodi di comportamento anomalo delle apparecchiature. Queste informazioni di etichettatura vengono fornite come CSV
file, in cui ogni riga specifica un intervallo di tempo durante il quale l'apparecchiatura non funzionava correttamente.
Ogni riga contiene due timestamp:
-
L'ora di inizio, che indica quando si ritiene che sia iniziato un comportamento anomalo.
-
L'ora di fine, che rappresenta la data in cui l'errore o il problema sono stati rilevati per la prima volta.
Questo file CSV è archiviato in un bucket Amazon S3 e viene utilizzato durante la formazione dei modelli per aiutare il sistema a imparare da esempi noti di comportamento anomalo. L'esempio seguente mostra come i dati dell'etichetta devono apparire come file. .csv
Il file non ha un'intestazione.
Esempio di un file CSV:
2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000 2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000 2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000
La riga 1 rappresenta un evento di manutenzione il 21 giugno 2024, con una finestra di 12 ore (dal 2024-06-21T00:00:00.000000Z
al2024-06-21T12:00:00.000000Z
) per individuare eventuali comportamenti AWS IoT SiteWise anomali.
La riga 2 rappresenta un evento di manutenzione l'11 luglio 2024, con una finestra di 12 ore (dal 2024-07-11T00:00:00.000000Z
al2024-07-11T12:00:00.000000Z
) per AWS IoT SiteWise cercare comportamenti anomali.
La riga 3 rappresenta un evento di manutenzione il 31 luglio 2024, con una finestra di 12 ore (dal 2024-07-31T00:00:00.000000Z
al2024-07-31T12:00:00.000000Z
) per AWS IoT SiteWise cercare comportamenti anomali.
AWS IoT SiteWise utilizza tutte queste finestre temporali per addestrare e valutare modelli in grado di identificare comportamenti anomali in relazione a questi eventi. Tieni presente che non tutti gli eventi sono rilevabili e i risultati dipendono in larga misura dalla qualità e dalle caratteristiche dei dati sottostanti.
Per informazioni dettagliate sulle migliori pratiche per il campionamento, vedere. Best practice
Fasi di etichettatura dei dati
-
Carica il file nel tuo bucket di etichettatura.
-
Aggiungi quanto segue a.
anomaly-detection-training-payload.json
-
Specificate le posizioni nella
labelInputConfiguration
sezione del file. Sostituiscilabels-bucket
con il nome del bucket efiles-prefix
con il percorso dei file o qualsiasi parte del prefisso. Tutti i file presenti nella posizione vengono analizzati e (in caso di successo) utilizzati come file di etichette.
-
{ "exportDataStartTime":
StartTime
, "exportDataEndTime":EndTime
, "labelInputConfiguration": { "bucketName": "label-bucket
", "prefix": "files-prefix
" } }
Esempio di una configurazione di etichetta:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "labelInputConfiguration": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv" } }
Valutazione del modello
La diagnostica puntuale del modello per un modello di AWS IoT SiteWise allenamento è una valutazione delle prestazioni del modello in occasione di singoli eventi. Durante l'addestramento, AWS IoT SiteWise genera un punteggio di anomalia e esegue una diagnostica del contributo dei sensori per ogni riga del set di dati di input. Un punteggio di anomalia più elevato indica una maggiore probabilità di un evento anomalo.
La diagnostica puntuale è disponibile quando si addestra un modello con ExecuteActionAPI e il tipo di azione. AWS/ANOMALY_DETECTION_TRAINING
Per configurare la valutazione del modello,
-
Aggiungi
anomaly-detection-training-payload.json
quanto segue a.-
Fornisci l'
evaluationStartTime
eevaluationEndTime
(entrambi in secondi epocali) per i dati nella finestra utilizzata per valutare le prestazioni del modello. -
Fornisci la posizione del bucket Amazon S3 (
resultDestination
) per scrivere la diagnostica di valutazione.
-
Nota
L'intervallo di valutazione del modello (dataStartTime
todataEndtime
) deve sovrapporsi o essere contiguo all'intervallo di addestramento. Non sono consentiti spazi vuoti.
{ "exportDataStartTime":
StartTime
, "exportDataEndTime":EndTime
, "modelEvaluationConfiguration": { "dataStartTime":evaluationStartTime
, "dataEndTime":evaluationEndTime
"resultDestination": { "bucketName": "s3BucketName
", "prefix": "bucketPrefix
" } } }
Esempio di una configurazione di valutazione del modello:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "modelEvaluationConfiguration": { "dataStartTime": 1722789360, "dataEndTime": 1725174000, "resultDestination": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl" } } }