Konfiguration der Samplerate Kennzeichnen Sie Ihre Daten Bewerten Ihres Modells Generieren Sie Modellmetriken

Fortgeschrittene Trainingskonfigurationen

Konfiguration der Abtastrate

Die Abtastrate definiert, wie häufig Sensorwerte aufgezeichnet werden (z. B. einmal pro Sekunde oder einmal pro Minute). Diese Einstellung wirkt sich direkt auf die Granularität der Trainingsdaten aus und beeinflusst die Fähigkeit des Modells, kurzfristige Schwankungen des Sensorverhaltens zu erfassen.

Besuchen Sie unsStichprobenerhebung für hochfrequente Daten und Konsistenz zwischen Training und Inferenz, um mehr über bewährte Verfahren zu erfahren.

Konfigurieren Sie die Ziel-Abtastrate

Sie können TargetSamplingRate in Ihrer Trainingskonfiguration optional eine angeben, um die Häufigkeit zu steuern, mit der Daten abgetastet werden. Unterstützte Werte sind:


PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H

Dies sind ISO 8601-Dauerformate, die die folgenden Zeitformate darstellen:

PT1S= 1 Sekunde
PT1M= 1 Minute
PT1H= 1 Stunde

Wählen Sie eine Abtastrate, die das richtige Gleichgewicht zwischen Datenauflösung und Trainingseffizienz bietet. Die folgenden Raten sind verfügbar:

Höhere Abtastraten (PT1S) bieten feinere Details, können jedoch das Datenvolumen und die Trainingszeit erhöhen.
Niedrigere Abtastraten (PT10M,PT1H) reduzieren Datengröße und Kosten, können jedoch kurzlebige Anomalien übersehen.

Behandlung von Zeitstempelfehlern

AWS IoT SiteWise kompensiert automatisch die falsche Ausrichtung von Zeitstempeln in mehreren Datenströmen während des Trainings. Dies gewährleistet ein konsistentes Modellverhalten, auch wenn die Eingangssignale zeitlich nicht perfekt aufeinander abgestimmt sind.

Besuchen Sie unsStichprobenerhebung für hochfrequente Daten und Konsistenz zwischen Training und Inferenz, um mehr über bewährte Verfahren zu erfahren.

Sampling aktivieren

Fügen Sie den folgenden Code zu hinzuanomaly-detection-training-payload.json.

Konfigurieren Sie das Sampling, indem TargetSamplingRate Sie die Payload für die Trainingsaktion mit der Sampling-Rate der Daten hinzufügen. Die zulässigen Werte sind:PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H.


{
    "exportDataStartTime": StartTime,
    "exportDataEndTime": EndTime,
    "targetSamplingRate": "TargetSamplingRate"
}

Beispiel einer Konfiguration mit Samplerate:


{
    "exportDataStartTime": 1717225200,
    "exportDataEndTime": 1722789360,
    "targetSamplingRate": "PT1M"
}

Kennzeichnen Sie Ihre Daten

Bei der Kennzeichnung Ihrer Daten müssen Sie Zeitintervalle definieren, die Perioden mit abnormalem Geräteverhalten darstellen. Diese Kennzeichnungsinformationen werden als CSV Datei bereitgestellt, wobei jede Zeile einen Zeitraum angibt, in dem die Geräte nicht ordnungsgemäß funktionierten.

Jede Zeile enthält zwei Zeitstempel:

Die Startzeit, die angibt, wann vermutlich abnormales Verhalten begonnen hat.
Die Endzeit, die angibt, wann der Fehler oder das Problem zum ersten Mal beobachtet wurde.

Diese CSV-Datei wird in einem Amazon S3 S3-Bucket gespeichert und wird beim Modelltraining verwendet, um dem System zu helfen, aus bekannten Beispielen für abnormales Verhalten zu lernen. Das folgende Beispiel zeigt, wie Ihre Etikettendaten als .csv Datei angezeigt werden sollten. Die Datei hat keinen Header.

Beispiel einer CSV-Datei:


2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000
2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000
2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000

Zeile 1 steht für ein Wartungsereignis am 21. Juni 2024 mit einem 12-Stunden-Fenster (von bis2024-06-21T12:00:00.000000Z), in dem 2024-06-21T00:00:00.000000Z nach abnormalem Verhalten gesucht werden AWS IoT SiteWise kann.

Zeile 2 steht für ein Wartungsereignis am 11. Juli 2024 mit einem 12-Stunden-Fenster (von bis2024-07-11T12:00:00.000000Z), in dem 2024-07-11T00:00:00.000000Z nach abnormalem AWS IoT SiteWise Verhalten gesucht werden kann.

Zeile 3 steht für ein Wartungsereignis am 31. Juli 2024 mit einem 12-Stunden-Fenster (von bis2024-07-31T12:00:00.000000Z), in dem 2024-07-31T00:00:00.000000Z nach abnormalem AWS IoT SiteWise Verhalten gesucht werden kann.

AWS IoT SiteWise verwendet all diese Zeitfenster, um Modelle zu trainieren und zu evaluieren, mit denen abnormales Verhalten im Zusammenhang mit diesen Ereignissen erkannt werden kann. Beachten Sie, dass nicht alle Ereignisse nachweisbar sind und die Ergebnisse stark von der Qualität und den Eigenschaften der zugrunde liegenden Daten abhängen.

Einzelheiten zu bewährten Methoden für die Probenahme finden Sie unterBewährte Methoden.

Schritte zur Datenkennzeichnung

Konfigurieren Sie Ihren Amazon S3 S3-Bucket gemäß den Kennzeichnungsvoraussetzungen unter Voraussetzungen für Kennzeichnungsdaten.
Laden Sie die Datei in Ihren Labeling-Bucket hoch.
Fügen Sie Folgendes hinzuanomaly-detection-training-payload.json.
- Geben Sie die Speicherorte im labelInputConfiguration Abschnitt der Datei an. labels-bucketErsetzen Sie es durch den Bucket-Namen und files-prefix durch den Pfad der Datei (en) oder einen beliebigen Teil des Präfixes. Alle Dateien am Speicherort werden analysiert und (bei Erfolg) als Labeldateien verwendet.


{
    "exportDataStartTime": StartTime,
    "exportDataEndTime": EndTime,
    "labelInputConfiguration": 
      {
       "bucketName": "label-bucket",
       "prefix": "files-prefix"
      }
}

Beispiel einer Labelkonfiguration:


{
    "exportDataStartTime": 1717225200,
    "exportDataEndTime": 1722789360,
    "labelInputConfiguration": {
      "bucketName": "anomaly-detection-customer-data-278129555252-iad",
      "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv"
    }
}

Bewerten Ihres Modells

Die punktuelle Modelldiagnostik für ein AWS IoT SiteWise Trainingsmodell ist eine Bewertung der Modellleistung bei den einzelnen Ereignissen. AWS IoT SiteWise Generiert während des Trainings einen Anomalie-Score und eine Diagnose des Sensorbeitrags für jede Zeile im Eingabedatensatz. Ein höherer Anomaliewert weist auf eine höhere Wahrscheinlichkeit eines abnormalen Ereignisses hin.

Punktgenaue Diagnosen sind verfügbar, wenn Sie ein Modell mit ExecuteActionAPI und AWS/ANOMALY_DETECTION_TRAINING Aktionstyp trainieren.

Um die Modellevaluierung zu konfigurieren,

Konfigurieren Sie Ihren Amazon S3 S3-Bucket gemäß den Kennzeichnungsvoraussetzungen unter Voraussetzungen für Kennzeichnungsdaten.
Fügen Sie Folgendes hinzuanomaly-detection-training-payload.json.
- Geben Sie die evaluationStartTime Werte und evaluationEndTime (beide in Epochensekunden) für die Daten in dem Fenster an, das zur Bewertung der Leistung des Modells verwendet wird.
- Geben Sie den Amazon S3 S3-Bucket-Standort (resultDestination) an, an den die Bewertungsdiagnose geschrieben werden soll.

Anmerkung

Das Modellevaluierungsintervall (dataStartTimebisdataEndtime) muss sich entweder mit dem Trainingsintervall überschneiden oder an dieses angrenzen. Lücken sind nicht zulässig.


{
  "exportDataStartTime": StartTime,
  "exportDataEndTime": EndTime,
  "modelEvaluationConfiguration": {
    "dataStartTime": evaluationStartTime,
    "dataEndTime": evaluationEndTime
    "resultDestination": {
      "bucketName": "s3BucketName",
      "prefix": "bucketPrefix"
    }
  }
}

Beispiel einer Konfiguration zur Modellevaluierung:


{
  "exportDataStartTime": 1717225200,
  "exportDataEndTime": 1722789360,
  "modelEvaluationConfiguration": {
    "dataStartTime": 1722789360,
    "dataEndTime": 1725174000,
    "resultDestination": {
      "bucketName": "anomaly-detection-customer-data-278129555252-iad",
      "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl"
    }
  }
}

Generieren Sie Modellmetriken

Modellmetriken bieten umfassende Einblicke in die Leistung und Qualität Ihrer trainierten Modelle zur Erkennung von Anomalien. Der Schulungsprozess generiert diese Metriken automatisch und veröffentlicht sie in Ihrem angegebenen Amazon S3 S3-Bucket, sodass sie für Analysen, Modellvergleiche und Beförderungsentscheidungen in Umschulungsworkflows leicht zugänglich sind.

Modellmetriken verstehen

Der Trainingsprozess generiert automatisch Modellmetriken und bietet detaillierte Informationen zu:

Modellleistung: Quantitative Messgrößen wie Präzision, Erinnerungsvermögen und AUC, sofern beschriftete Daten verfügbar sind
Datenqualität: Informationen über die verwendeten Trainingsdaten und die erfassten Zeiträume
Erkennung von Ereignissen: Statistiken über identifizierte Anomalien und markierte Ereignisse
Modellvergleich: Vergleichsmetriken zwischen verschiedenen Modellversionen während der Umschulung

Konfigurieren Sie das Ziel für Modellmetriken

Um die Generierung von Modellmetriken zu aktivieren, konfigurieren Sie ein Amazon S3 S3-Ziel, in dem die Metriken veröffentlicht werden.

Konfigurieren Sie Ihren Amazon S3 S3-Bucket gemäß derVoraussetzungen für die Modellevaluierung.

Fügen Sie Ihrer Payload für Trainingsaktionen Folgendes hinzu, um anzugeben, wo Modellmetriken gespeichert werden sollen:


{
    "trainingMode": "TRAIN_MODEL",
    "exportDataStartTime": StartTime,
    "exportDataEndTime": EndTime,
    "modelMetricsDestination": {
        "bucketName": "bucket-name",
        "prefix": "prefix"
    }
}

Beispiel für die Konfiguration von Modellmetriken


{
    "exportDataStartTime": 1717225200,
    "exportDataEndTime": 1722789360,
    "modelMetricsDestination": {
        "bucketName": "anomaly-detection-metrics-bucket-123456789012-iad",
        "prefix": "ModelMetrics/computation-model-id/asset-id/training-metrics.json"
    }
}

Konfigurieren Sie Modellmetriken für die Umschulung

Wenn Sie Umschulungspläne einrichten, müssen Sie das Ziel der Modellmetriken angeben, um eine umfassende Nachverfolgung und einen Vergleich der Modellleistung zu ermöglichen:


{
    "trainingMode": "START_RETRAINING_SCHEDULER",
    "modelMetricsDestination": {
        "bucketName": "bucket-name",
        "prefix": "prefix"
    },
    "retrainingConfiguration": {
        "lookbackWindow": "P180D",
        "promotion": "SERVICE_MANAGED",
        "retrainingFrequency": "P30D",
        "retrainingStartDate": "StartDate"
    }
}

Parameter

bucketName: Amazon S3 S3-Bucket, in dem Modellmetriken gespeichert werden
prefix: Amazon S3 prefix/path zum Organisieren von Modellmetrikdateien

Struktur der Modellmetriken

Modellmetriken werden als JSON-Dateien in Ihrem Amazon S3 S3-Bucket in der folgenden Struktur gespeichert:


{
    "labeled_ranges": [],
    "labeled_event_metrics": {
        "num_labeled": 0,
        "num_identified": 0,
        "total_warning_time_in_seconds": 0
    },
    "predicted_ranges": [],
    "unknown_event_metrics": {
        "num_identified": 0,
        "total_duration_in_seconds": 0
    },
    "data_start_time": "2023-11-01",
    "data_end_time": "2023-12-31",
    "labels_present": false,
    "model_version_metrics": {
        "precision": 1.0,
        "recall": 1.0,
        "mean_fractional_lead_time": 0.7760964912280702,
        "auc": 0.5971207364893062
    }
}

Die wichtigsten Metriken

labeled_ranges: Zeitbereiche, in denen während der Schulung markierte Anomalien festgestellt wurden
labeled_event_metrics: Statistiken darüber, wie gut das Modell bekannte markierte Ereignisse identifizierte
num_labeled: Gesamtzahl der markierten Ereignisse in den Trainingsdaten
num_identified: Anzahl der markierten Ereignisse, die das Modell korrekt identifiziert hat
total_warning_time_in_seconds: Gesamtzeit, die das Modell für markierte Ereignisse im Warnstatus verbracht hat
predicted_ranges: Zeitbereiche, in denen das Modell während der Evaluierung Anomalien vorhergesagt hat
unknown_event_metrics: Statistiken über Anomalien, die in unmarkierten Daten festgestellt wurden
data_start_time / data_end_time: Zeitfenster, das von den Trainingsdaten abgedeckt wird
labels_present: Boolescher Wert, der angibt, ob während des Trainings beschriftete Daten verwendet wurden
model_version_metrics: Zusätzliche versionsspezifische Metriken für den Modellvergleich

Erweiterte Metriken für beschriftete Modelle

Wenn Sie während des Trainings beschriftete Daten angeben, sind zusätzliche Leistungskennzahlen in den Amazon S3 S3-Dateien enthalten:

Erinnerung: Der Anteil der Ereignisse, die AWS IoT SiteWise korrekt identifiziert wurden, an den Ereignissen, die Sie im selben Zeitraum gekennzeichnet haben. Beispielsweise haben Sie möglicherweise 10 Ereignisse gekennzeichnet, aber AWS IoT SiteWise nur 9 davon identifiziert. In diesem Fall liegt der Rückruf bei 90%.
Präzision: Der Anteil der wirklich positiven Ergebnisse an der Gesamtzahl der identifizierten Ereignisse. Wenn beispielsweise 10 Ereignisse AWS IoT SiteWise identifiziert werden, aber nur 7 dieser Ereignisse den von Ihnen beschrifteten Ereignissen entsprechen, liegt die Genauigkeit bei 70%.
MeanFractionalLeadTime: Ein Maß dafür, wie schnell (im Verhältnis zur Dauer des Ereignisses) jedes Ereignis im Durchschnitt AWS IoT SiteWise erkannt wird. Ein typisches Ereignis in Ihrer Einrichtung kann beispielsweise 10 Stunden dauern. Im Durchschnitt kann es 3 Stunden dauern, bis das Modell das Ereignis identifiziert hat. In diesem Fall beträgt die durchschnittliche Teilvorlaufzeit 0,7.
AUC: Area Under the Curve (AUC) misst die Fähigkeit eines Modells für maschinelles Lernen, für positive Beispiele eine höhere Punktzahl vorherzusagen als für negative Beispiele. Ein Wert zwischen 0 und 1, der angibt, wie gut Ihr Modell die Kategorien in Ihrem Datensatz trennen kann. Ein Wert von 1 gibt an, dass die Kategorien perfekt getrennt werden konnten.

Werbung für Modelle und Metriken

Bei Umschulungsabläufen ermöglichen die in Amazon S3 gespeicherten Kennzahlen fundierte Entscheidungen zur Modellförderung:

Verwalteter Modus (Automatische Beförderung)

Das System vergleicht anhand der in Amazon S3 gespeicherten Daten automatisch Metriken zwischen alten und neuen Modellversionen
Modelle werden auf der Grundlage verbesserter Leistungsindikatoren beworben
Entscheidungen zur Beförderung beinhalten spezifische Ursachencodes, die zusammen mit den Kennzahlen gespeichert werden:
- AUTO_PROMOTION_SUCCESSFUL: Neue Modellmetriken sind besser als die aktuelle Version
- MODEL_METRICS_DIDNT_IMPROVE: Die Leistung des neuen Modells hat sich nicht verbessert
- POOR_MODEL_QUALITY_DETECTED: Das neue Modell hat eine schlechte Qualitätsbewertung

Manueller Modus (vom Kunden gesteuerte Werbung)

Sie können detaillierte Messwerte von Amazon S3 herunterladen und analysieren, um Entscheidungen über Werbeaktionen zu treffen
Alle historischen Modellversionen und ihre Metriken bleiben in Amazon S3 zugänglich
Sie können mithilfe der in Amazon S3 gespeicherten Metriken benutzerdefinierte Dashboards und Analysetools erstellen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Ermöglichen Sie die Erkennung von Anomalien an Sensoren in allen Anlagen

Erweiterte Inferenzkonfigurationen