Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configurations d'entraînement avancées
Configuration de la fréquence d'échantillonnage
La fréquence d'échantillonnage définit la fréquence à laquelle les mesures du capteur sont enregistrées (par exemple, une fois par seconde ou une fois par minute). Ce paramètre a un impact direct sur la granularité des données d'entraînement et influence la capacité du modèle à capturer les variations à court terme du comportement des capteurs.
Visitez Échantillonnage pour les données à haute fréquence et cohérence entre l'entraînement et l'inférence pour en savoir plus sur les meilleures pratiques.
Configurer le taux d'échantillonnage cible
Vous pouvez éventuellement spécifier un TargetSamplingRate
dans votre configuration d'entraînement, afin de contrôler la fréquence à laquelle les données sont échantillonnées. Les valeurs prises en charge sont :
PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
Il s'agit des formats de durée ISO 8601, qui représentent les formats temporels suivants :
-
PT1S
= 1 seconde -
PT1M
= 1 minute -
PT1H
= 1 heure
Choisissez un taux d'échantillonnage qui trouve le juste équilibre entre résolution des données et efficacité de la formation. Les tarifs suivants sont disponibles :
-
Des taux d'échantillonnage plus élevés (
PT1S
) permettent d'obtenir des détails plus fins mais peuvent augmenter le volume de données et le temps d'entraînement. -
Des taux d'échantillonnage plus faibles (
PT10M
,PT1H
) réduisent la taille et le coût des données, mais peuvent passer à côté d'anomalies de courte durée.
Gestion du désalignement de l'horodatage
AWS IoT SiteWise compense automatiquement le mauvais alignement de l'horodatage sur plusieurs flux de données pendant l'entraînement. Cela garantit un comportement cohérent du modèle même si les signaux d'entrée ne sont pas parfaitement alignés dans le temps.
Visitez Échantillonnage pour les données à haute fréquence et cohérence entre l'entraînement et l'inférence pour en savoir plus sur les meilleures pratiques.
Activer l'échantillonnage
Ajoutez le code suivant àanomaly-detection-training-payload.json
.
Configurez l'échantillonnage TargetSamplingRate
en ajoutant la charge utile de l'action d'entraînement, avec le taux d'échantillonnage des données. Les valeurs autorisées sont :PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
.
{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "targetSamplingRate": "TargetSamplingRate" }
Exemple d'une configuration de fréquence d'échantillonnage :
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "targetSamplingRate": "PT1M" }
Étiquetez vos données
Lorsque vous étiquetez vos données, vous devez définir des intervalles de temps qui représentent les périodes de comportement anormal de l'équipement. Ces informations d'étiquetage sont fournies sous forme de CSV
fichier, où chaque ligne indique une plage de temps pendant laquelle l'équipement ne fonctionnait pas correctement.
Chaque ligne contient deux horodatages :
-
L'heure de début, indiquant le moment où un comportement anormal est censé avoir commencé.
-
L'heure de fin, qui représente le moment où la défaillance ou le problème a été observé pour la première fois.
Ce fichier CSV est stocké dans un compartiment Amazon S3 et est utilisé lors de l'entraînement des modèles pour aider le système à tirer des leçons d'exemples connus de comportements anormaux. L'exemple suivant montre comment les données de votre étiquette doivent apparaître sous forme de .csv
fichier. Le fichier n'a pas d'en-tête.
Exemple d'un fichier CSV :
2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000 2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000 2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000
La ligne 1 représente un événement de maintenance survenu le 21 juin 2024, avec une fenêtre de 12 heures (de 2024-06-21T00:00:00.000000Z
à2024-06-21T12:00:00.000000Z
) AWS IoT SiteWise pour rechercher un comportement anormal.
La ligne 2 représente un événement de maintenance survenu le 11 juillet 2024, avec une fenêtre de 12 heures (de 2024-07-11T00:00:00.000000Z
à2024-07-11T12:00:00.000000Z
) AWS IoT SiteWise pour rechercher un comportement anormal.
La ligne 3 représente un événement de maintenance survenu le 31 juillet 2024, avec une fenêtre de 12 heures (de 2024-07-31T00:00:00.000000Z
à2024-07-31T12:00:00.000000Z
) AWS IoT SiteWise pour rechercher un comportement anormal.
AWS IoT SiteWise utilise toutes ces fenêtres temporelles pour entraîner et évaluer des modèles capables d'identifier les comportements anormaux liés à ces événements. Notez que tous les événements ne sont pas détectables et que les résultats dépendent fortement de la qualité et des caractéristiques des données sous-jacentes.
Pour plus de détails sur les meilleures pratiques en matière d'échantillonnage, voirBonnes pratiques.
Étapes d'étiquetage des données
-
Configurez votre compartiment Amazon S3 conformément aux conditions d'étiquetage requises dans la section Conditions requises pour les données d'étiquetage.
-
Téléchargez le fichier dans votre compartiment d'étiquetage.
-
Ajoutez ce qui suit à
anomaly-detection-training-payload.json
.-
Indiquez les emplacements dans la
labelInputConfiguration
section du fichier. Remplacezlabels-bucket
par le nom du compartiment etfiles-prefix
par le chemin du ou des fichiers ou toute partie du préfixe. Tous les fichiers de cet emplacement sont analysés et (en cas de succès) utilisés comme fichiers d'étiquette.
-
{ "exportDataStartTime":
StartTime
, "exportDataEndTime":EndTime
, "labelInputConfiguration": { "bucketName": "label-bucket
", "prefix": "files-prefix
" } }
Exemple d'une configuration d'étiquette :
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "labelInputConfiguration": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv" } }
Évaluation de votre modèle
Le diagnostic ponctuel d'un modèle d' AWS IoT SiteWise entraînement consiste en une évaluation des performances du modèle lors d'événements individuels. Pendant l'entraînement, AWS IoT SiteWise génère un score d'anomalie et des diagnostics de contribution du capteur pour chaque ligne de l'ensemble de données d'entrée. Un score d'anomalie plus élevé indique une probabilité plus élevée d'un événement anormal.
Des diagnostics ponctuels sont disponibles lorsque vous entraînez un modèle avec une ExecuteActionAPI et un type AWS/ANOMALY_DETECTION_TRAINING
d'action.
Pour configurer l'évaluation du modèle,
-
Configurez votre compartiment Amazon S3 conformément aux exigences d'étiquetage de la section Conditions requises pour les données d'étiquetage.
-
Ajoutez ce qui suit à
anomaly-detection-training-payload.json
.-
Indiquez le
evaluationStartTime
etevaluationEndTime
(les deux en secondes d'époque) pour les données de la fenêtre utilisée pour évaluer les performances du modèle. -
Indiquez l'emplacement du compartiment Amazon S3 (
resultDestination
) dans lequel les diagnostics d'évaluation seront écrits.
-
Note
L'intervalle d'évaluation du modèle (dataStartTime
todataEndtime
) doit soit se chevaucher, soit être contigu à l'intervalle d'entraînement. Aucune lacune n'est autorisée.
{ "exportDataStartTime":
StartTime
, "exportDataEndTime":EndTime
, "modelEvaluationConfiguration": { "dataStartTime":evaluationStartTime
, "dataEndTime":evaluationEndTime
"resultDestination": { "bucketName": "s3BucketName
", "prefix": "bucketPrefix
" } } }
Exemple d'une configuration d'évaluation du modèle :
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "modelEvaluationConfiguration": { "dataStartTime": 1722789360, "dataEndTime": 1725174000, "resultDestination": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl" } } }