Konfigurasi pelatihan lanjutan - AWS IoT SiteWise

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konfigurasi pelatihan lanjutan

Konfigurasi laju sampel

Laju sampel menentukan seberapa sering pembacaan sensor direkam (misalnya, sekali setiap detik, atau sekali setiap menit). Pengaturan ini secara langsung berdampak pada perincian data pelatihan, dan memengaruhi kemampuan model untuk menangkap variasi jangka pendek dalam perilaku sensor.

Kunjungi Pengambilan sampel untuk data frekuensi tinggi dan konsistensi antara pelatihan dan inferensi untuk mempelajari praktik terbaik.

Konfigurasikan laju pengambilan sampel target

Anda dapat secara opsional menentukan a TargetSamplingRate dalam konfigurasi pelatihan Anda, untuk mengontrol frekuensi di mana data diambil sampelnya. Nilai yang didukung adalah:

PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H

Ini adalah format durasi ISO 8601, yang mewakili format waktu berikut:

  • PT1S= 1 detik

  • PT1M= 1 menit

  • PT1H= 1 jam

Pilih laju pengambilan sampel yang mencapai keseimbangan yang tepat antara resolusi data, dan efisiensi pelatihan. Tarif berikut tersedia:

  • Tingkat pengambilan sampel yang lebih tinggi (PT1S) menawarkan detail yang lebih halus tetapi dapat meningkatkan volume data dan waktu pelatihan.

  • Tingkat pengambilan sampel yang lebih rendah (PT10M,PT1H) mengurangi ukuran dan biaya data tetapi mungkin melewatkan anomali berumur pendek.

Menangani ketidaksejajaran stempel waktu

AWS IoT SiteWise secara otomatis mengkompensasi ketidaksejajaran stempel waktu di beberapa aliran data selama pelatihan. Ini memastikan perilaku model yang konsisten bahkan jika sinyal input tidak selaras sempurna dalam waktu.

Kunjungi Pengambilan sampel untuk data frekuensi tinggi dan konsistensi antara pelatihan dan inferensi untuk mempelajari praktik terbaik.

Aktifkan pengambilan sampel

Tambahkan kode berikut keanomaly-detection-training-payload.json.

Konfigurasikan pengambilan sampel TargetSamplingRate dengan menambahkan muatan tindakan pelatihan, dengan laju pengambilan sampel data. Nilai yang diizinkan adalah:PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H.

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "targetSamplingRate": "TargetSamplingRate" }
contoh dari konfigurasi laju sampel:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "targetSamplingRate": "PT1M" }

Beri label data Anda

Saat memberi label pada data Anda, Anda harus menentukan interval waktu yang mewakili periode perilaku peralatan abnormal. Informasi pelabelan ini disediakan sebagai CSV file, di mana setiap baris menentukan rentang waktu di mana peralatan tidak beroperasi dengan benar.

Setiap baris berisi dua stempel waktu:

  • Waktu mulai, menunjukkan kapan perilaku abnormal diyakini telah dimulai.

  • Waktu akhir, mewakili kapan kegagalan atau masalah pertama kali diamati.

File CSV ini disimpan dalam bucket Amazon S3 dan digunakan selama pelatihan model untuk membantu sistem belajar dari contoh perilaku abnormal yang diketahui. Contoh berikut menunjukkan bagaimana data label Anda akan muncul sebagai .csv file. File tidak memiliki header.

contoh dari file CSV:
2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000 2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000 2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000

Baris 1 mewakili acara pemeliharaan pada 21 Juni 2024, dengan jendela 12 jam (dari 2024-06-21T00:00:00.000000Z ke2024-06-21T12:00:00.000000Z) AWS IoT SiteWise untuk mencari perilaku abnormal.

Baris 2 mewakili acara pemeliharaan pada 11 Juli 2024, dengan jendela 12 jam (dari 2024-07-11T00:00:00.000000Z ke2024-07-11T12:00:00.000000Z) AWS IoT SiteWise untuk mencari perilaku abnormal.

Baris 3 mewakili acara pemeliharaan pada 31 Juli 2024, dengan jendela 12 jam (dari 2024-07-31T00:00:00.000000Z ke2024-07-31T12:00:00.000000Z) AWS IoT SiteWise untuk mencari perilaku abnormal.

AWS IoT SiteWise menggunakan semua jendela waktu ini untuk melatih dan mengevaluasi model yang dapat mengidentifikasi perilaku abnormal di sekitar peristiwa ini. Perhatikan bahwa tidak semua peristiwa dapat dideteksi, dan hasilnya sangat bergantung pada kualitas dan karakteristik data yang mendasarinya.

Untuk detail tentang praktik terbaik untuk pengambilan sampel, lihatPraktik terbaik.

Langkah-langkah pelabelan data

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "labelInputConfiguration": { "bucketName": "label-bucket", "prefix": "files-prefix" } }
contoh dari konfigurasi label:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "labelInputConfiguration": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv" } }

Evaluasi model Anda

Diagnostik model pointwise untuk model AWS IoT SiteWise pelatihan adalah evaluasi kinerja model pada acara individu. Selama pelatihan, AWS IoT SiteWise hasilkan skor anomali, dan diagnostik kontribusi sensor untuk setiap baris dalam kumpulan data input. Skor anomali yang lebih tinggi menunjukkan kemungkinan kejadian abnormal yang lebih tinggi.

Diagnostik pointwise tersedia, saat Anda melatih model dengan ExecuteActionAPI, dan AWS/ANOMALY_DETECTION_TRAINING tipe tindakan.

Untuk mengkonfigurasi evaluasi model,

catatan

Interval evaluasi model (dataStartTimetodataEndtime) harus tumpang tindih, atau berdekatan dengan interval pelatihan. Tidak ada celah yang diizinkan.

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "modelEvaluationConfiguration": { "dataStartTime": evaluationStartTime, "dataEndTime": evaluationEndTime "resultDestination": { "bucketName": "s3BucketName", "prefix": "bucketPrefix" } } }
contoh dari konfigurasi evaluasi model:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "modelEvaluationConfiguration": { "dataStartTime": 1722789360, "dataEndTime": 1725174000, "resultDestination": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl" } } }

Hasilkan metrik model

Metrik model memberikan wawasan komprehensif tentang kinerja dan kualitas model deteksi anomali terlatih Anda. Proses pelatihan secara otomatis menghasilkan metrik ini dan menerbitkannya ke bucket Amazon S3 yang Anda tentukan, sehingga mudah diakses untuk analisis, perbandingan model, dan keputusan promosi dalam alur kerja pelatihan ulang.

Memahami metrik model

Proses pelatihan secara otomatis menghasilkan metrik model dan memberikan informasi terperinci tentang:

  • Kinerja Model: Ukuran kuantitatif seperti presisi, penarikan, dan AUC saat data berlabel tersedia

  • Kualitas Data: Informasi tentang data pelatihan yang digunakan dan periode waktu yang tercakup

  • Deteksi Peristiwa: Statistik tentang anomali yang diidentifikasi dan peristiwa berlabel

  • Perbandingan Model: Metrik perbandingan antara versi model yang berbeda selama pelatihan ulang

Konfigurasikan tujuan metrik model

Untuk mengaktifkan pembuatan metrik model, konfigurasikan tujuan Amazon S3 tempat metrik dipublikasikan.

  1. Konfigurasikan bucket Amazon S3 Anda sesuai. Prasyarat evaluasi model

  2. Tambahkan yang berikut ini ke payload tindakan pelatihan Anda untuk menentukan di mana metrik model harus disimpan:

    { "trainingMode": "TRAIN_MODEL", "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "modelMetricsDestination": { "bucketName": "bucket-name", "prefix": "prefix" } }
    contoh Contoh konfigurasi metrik model
    { "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "modelMetricsDestination": { "bucketName": "anomaly-detection-metrics-bucket-123456789012-iad", "prefix": "ModelMetrics/computation-model-id/asset-id/training-metrics.json" } }

Konfigurasikan metrik model untuk pelatihan ulang

Saat Anda menyiapkan jadwal pelatihan ulang, tujuan metrik model diperlukan untuk mengaktifkan pelacakan dan perbandingan kinerja model yang komprehensif:

{ "trainingMode": "START_RETRAINING_SCHEDULER", "modelMetricsDestination": { "bucketName": "bucket-name", "prefix": "prefix" }, "retrainingConfiguration": { "lookbackWindow": "P180D", "promotion": "SERVICE_MANAGED", "retrainingFrequency": "P30D", "retrainingStartDate": "StartDate" } }
Parameter
bucketName

Bucket Amazon S3 tempat metrik model akan disimpan

prefix

Amazon S3 prefix/path untuk mengatur file metrik model

Struktur metrik model

Metrik model disimpan sebagai file JSON di bucket Amazon S3 Anda dalam struktur berikut:

{ "labeled_ranges": [], "labeled_event_metrics": { "num_labeled": 0, "num_identified": 0, "total_warning_time_in_seconds": 0 }, "predicted_ranges": [], "unknown_event_metrics": { "num_identified": 0, "total_duration_in_seconds": 0 }, "data_start_time": "2023-11-01", "data_end_time": "2023-12-31", "labels_present": false, "model_version_metrics": { "precision": 1.0, "recall": 1.0, "mean_fractional_lead_time": 0.7760964912280702, "auc": 0.5971207364893062 } }
Metrik kunci
labeled_ranges

Rentang waktu di mana anomali berlabel diberikan selama pelatihan

labeled_event_metrics

Statistik tentang seberapa baik model mengidentifikasi peristiwa berlabel yang diketahui

num_labeled

Jumlah total acara berlabel dalam data pelatihan

num_identified

Jumlah peristiwa berlabel yang diidentifikasi dengan benar oleh model

total_warning_time_in_seconds

Total waktu yang dihabiskan model dalam status peringatan untuk acara berlabel

predicted_ranges

Rentang waktu di mana model memprediksi anomali selama evaluasi

unknown_event_metrics

Statistik tentang anomali yang terdeteksi dalam data yang tidak berlabel

data_start_time / data_end_time

Jendela waktu yang dicakup oleh data pelatihan

labels_present

Boolean menunjukkan apakah data berlabel digunakan selama pelatihan

model_version_metrics

Metrik khusus versi tambahan untuk perbandingan model

Metrik lanjutan untuk model berlabel

Saat Anda memberikan data berlabel selama pelatihan, metrik kinerja tambahan disertakan dalam file Amazon S3:

  • Ingat: Proporsi peristiwa yang diidentifikasi AWS IoT SiteWise dengan benar pada peristiwa yang Anda beri label selama periode yang sama. Misalnya, Anda mungkin telah memberi label 10 peristiwa, tetapi AWS IoT SiteWise hanya mengidentifikasi 9 di antaranya. Dalam hal ini, penarikan kembali adalah 90%.

  • Presisi: Proporsi positif sejati terhadap total peristiwa yang diidentifikasi. Misalnya, jika AWS IoT SiteWise mengidentifikasi 10 peristiwa, tetapi hanya 7 dari peristiwa tersebut yang sesuai dengan peristiwa yang Anda beri label, maka ketepatannya adalah 70%.

  • MeanFractionalLeadTime: Pengukuran seberapa cepat (relatif terhadap panjang acara), rata-rata, AWS IoT SiteWise mendeteksi setiap peristiwa. Misalnya, acara khas di fasilitas Anda dapat berlangsung 10 jam. Rata-rata, mungkin diperlukan model 3 jam untuk mengidentifikasi acara tersebut. Dalam hal ini, lead time fraksional rata-rata adalah 0,7.

  • AUC: Area Under the Curve (AUC) mengukur kemampuan model pembelajaran mesin untuk memprediksi skor yang lebih tinggi untuk contoh positif dibandingkan dengan contoh negatif. Nilai antara 0 dan 1 yang menunjukkan seberapa baik model Anda dapat memisahkan kategori dalam kumpulan data Anda. Nilai 1 menunjukkan bahwa ia mampu memisahkan kategori dengan sempurna.

Promosi dan metrik model

Selama pelatihan ulang alur kerja, metrik yang disimpan di Amazon S3 memungkinkan keputusan promosi model yang terinformasi:

Mode terkelola (Promosi otomatis)

  • Sistem secara otomatis membandingkan metrik antara versi model lama dan baru menggunakan data yang disimpan Amazon S3

  • Model dipromosikan berdasarkan indikator kinerja yang ditingkatkan

  • Keputusan promosi mencakup kode alasan spesifik yang disimpan bersama metrik:

    • AUTO_PROMOTION_SUCCESSFUL: Metrik model baru lebih baik dari versi saat ini

    • MODEL_METRICS_DIDNT_IMPROVE: Kinerja model baru tidak membaik

    • POOR_MODEL_QUALITY_DETECTED: Model baru memiliki penilaian kualitas yang buruk

Mode manual (Promosi yang dikendalikan pelanggan)

  • Anda dapat mengunduh dan menganalisis metrik terperinci dari Amazon S3 untuk membuat keputusan promosi

  • Semua versi model historis dan metriknya tetap dapat diakses di Amazon S3

  • Anda dapat membuat dasbor khusus dan alat analisis menggunakan metrik yang disimpan Amazon S3