Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Best practice
Comprendi l'intervallo di date minimo
Utilizza un minimo di 14 giorni per la durata dei dati di allenamento. Tuttavia, in molti casi ti consigliamo di includere un periodo di dati più lungo.
Assicurati che il set di dati di addestramento copra un periodo di tempo durante il quale l'asset funzioni in tutte le sue normali modalità operative. Questo approccio aiuta a distinguere AWS IoT SiteWise con precisione tra il comportamento previsto e le anomalie reali.
Se i dati di addestramento non rappresentano tutte le modalità operative tipiche, è AWS IoT SiteWise possibile contrassegnare erroneamente modelli non familiari ma normali come anomalie, con conseguente aumento dei falsi positivi.
Campionamento per dati ad alta frequenza e coerenza tra addestramento e inferenza
Se i sensori generano dati a una frequenza superiore a 1 Hz (più di una lettura al secondo), applica il campionamento durante l'allenamento. Il campionamento riduce il volume dei dati preservando al contempo le tendenze essenziali, il che consente un'elaborazione efficiente e migliora la generalizzazione del modello riducendo al minimo l'impatto del rumore o delle fluttuazioni transitorie.
AWS IoT SiteWise il rilevamento nativo delle anomalie attualmente non supporta l'immissione di dati a frequenze inferiori a 1 Hz. Verifica che i tuoi dati soddisfino questo requisito di frequenza minima prima di configurare il rilevamento delle anomalie.
Inoltre, AWS IoT SiteWise utilizza la frequenza di campionamento configurata durante l'allenamento anche per l'inferenza. Per mantenere la coerenza e garantire risultati accurati nel rilevamento delle anomalie, scegliete una frequenza di campionamento in linea sia con le esigenze operative che con il comportamento dei dati del sensore.
Scopri maggiori dettagli su come impostare la frequenza di campionamento a. configurazione della frequenza di campionamento
Raccomandazioni sull'etichettatura
L'etichettatura accurata e coerente delle anomalie è essenziale per una valutazione efficace del modello e un miglioramento continuo. Quando etichettate le anomalie, prendete in considerazione le seguenti best practice:
-
Consolida le anomalie correlate: non etichettate le anomalie che si verificano da vicino come eventi separati, se fanno parte dello stesso problema di fondo. Ad esempio, se le anomalie si verificano entro 1-2 giorni l'una dall'altra e sono causate dalla stessa causa principale, trattale come un'unica finestra di anomalia. Questo approccio aiuta il modello ad apprendere meglio il modello di comportamento anomalo e riduce il rumore nei dati di valutazione.
-
Etichetta le finestre di anomalia, non solo i punti: invece di contrassegnare i singoli punti dati come anomali, etichetta l'intera finestra che riflette il comportamento anomalo dall'insorgenza della deviazione al ripristino. Questo approccio fornisce confini più chiari e migliora l'allineamento del modello ai problemi operativi effettivi.
-
Escludi periodi incerti: se non sei sicuro che un periodo sia anomalo, lascialo senza etichetta. Le etichette ambigue possono confondere il modello e ridurne la precisione nel tempo.
Puoi trovare maggiori dettagli su come aggiungere etichette all'indirizzo. Etichetta i tuoi dati