Configuraciones de entrenamiento avanzadas - AWS IoT SiteWise

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuraciones de entrenamiento avanzadas

configuración de frecuencia de muestreo

La frecuencia de muestreo define la frecuencia con la que se registran las lecturas del sensor (por ejemplo, una vez cada segundo o una vez cada minuto). Esta configuración afecta directamente a la granularidad de los datos de entrenamiento e influye en la capacidad del modelo para capturar las variaciones a corto plazo en el comportamiento de los sensores.

Toma de muestras para obtener datos de alta frecuencia y garantizar la coherencia entre el entrenamiento y la inferenciaVisítelo para obtener información sobre las mejores prácticas.

Configure la frecuencia de muestreo objetivo

Si lo desea, puede especificar una TargetSamplingRate en su configuración de entrenamiento para controlar la frecuencia con la que se muestrean los datos. Los valores admitidos son:

PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H

Estos son los formatos de duración ISO 8601, que representan los siguientes formatos de tiempo:

  • PT1S= 1 segundo

  • PT1M= 1 minuto

  • PT1H= 1 hora

Elija una frecuencia de muestreo que logre el equilibrio adecuado entre la resolución de los datos y la eficiencia del entrenamiento. Están disponibles las siguientes tasas:

  • Las frecuencias de muestreo más altas (PT1S) ofrecen detalles más precisos, pero pueden aumentar el volumen de datos y el tiempo de entrenamiento.

  • Las frecuencias de muestreo más bajas (PT10M,PT1H) reducen el tamaño y el costo de los datos, pero pueden pasar por alto anomalías efímeras.

Manejar la desalineación de las marcas de tiempo

AWS IoT SiteWise compensa automáticamente la desalineación de las marcas de tiempo en varios flujos de datos durante el entrenamiento. Esto garantiza un comportamiento uniforme del modelo, incluso si las señales de entrada no están perfectamente alineadas en el tiempo.

Toma de muestras para obtener datos de alta frecuencia y garantizar la coherencia entre el entrenamiento y la inferenciaVisítelo para obtener información sobre las mejores prácticas.

Habilite el muestreo

Añada el siguiente código aanomaly-detection-training-payload.json.

Configure el muestreo añadiendo TargetSamplingRate la carga útil de la acción de entrenamiento, con la frecuencia de muestreo de los datos. Los valores permitidos son:PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H.

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "targetSamplingRate": "TargetSamplingRate" }
ejemplo de una configuración de frecuencia de muestreo:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "targetSamplingRate": "PT1M" }

Etiquete sus datos

Al etiquetar los datos, debe definir intervalos de tiempo que representen períodos de comportamiento anormal del equipo. Esta información de etiquetado se proporciona como un CSV archivo, en el que cada fila especifica un intervalo de tiempo durante el cual el equipo no funcionó correctamente.

Cada fila contiene dos marcas de tiempo:

  • La hora de inicio, que indica cuándo se cree que ha comenzado un comportamiento anormal.

  • La hora de finalización, que representa el momento en que se observó por primera vez la falla o el problema.

Este archivo CSV se almacena en un bucket de Amazon S3 y se utiliza durante el entrenamiento de modelos para ayudar al sistema a aprender de ejemplos conocidos de comportamiento anormal. En el siguiente ejemplo, se muestra cómo deben aparecer los datos de la etiqueta como un .csv archivo. El archivo no tiene encabezado.

ejemplo de un archivo CSV:
2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000 2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000 2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000

La fila 1 representa un evento de mantenimiento ocurrido el 21 de junio de 2024, con un período de 12 horas (de 2024-06-21T00:00:00.000000Z a2024-06-21T12:00:00.000000Z) AWS IoT SiteWise para detectar un comportamiento anormal.

La fila 2 representa un evento de mantenimiento ocurrido el 11 de julio de 2024, con un intervalo de 12 horas (de 2024-07-11T00:00:00.000000Z a2024-07-11T12:00:00.000000Z) AWS IoT SiteWise para detectar un comportamiento anormal.

La fila 3 representa un evento de mantenimiento ocurrido el 31 de julio de 2024, con un intervalo de 12 horas (de 2024-07-31T00:00:00.000000Z a2024-07-31T12:00:00.000000Z) AWS IoT SiteWise para detectar un comportamiento anormal.

AWS IoT SiteWise utiliza todos estos intervalos de tiempo para entrenar y evaluar modelos que puedan identificar un comportamiento anormal en torno a estos eventos. Tenga en cuenta que no todos los eventos son detectables y que los resultados dependen en gran medida de la calidad y las características de los datos subyacentes.

Para obtener más información sobre las mejores prácticas de muestreo, consultePrácticas recomendadas.

Pasos para el etiquetado de datos

  • Configure su depósito de Amazon S3 de acuerdo con los requisitos previos de etiquetado en Requisitos previos de etiquetado de datos.

  • Cargue el archivo en su balde de etiquetado.

  • Añada lo siguiente aanomaly-detection-training-payload.json.

    • Proporcione las ubicaciones en la labelInputConfiguration sección del archivo. labels-bucketSustitúyalo por el nombre del depósito y files-prefix por la ruta del archivo o cualquier parte del prefijo. Todos los archivos de la ubicación se analizan y (en caso de éxito) se utilizan como archivos de etiquetas.

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "labelInputConfiguration": { "bucketName": "label-bucket", "prefix": "files-prefix" } }
ejemplo de una configuración de etiquetas:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "labelInputConfiguration": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv" } }

Evaluar el modelo

El diagnóstico puntual de un modelo de AWS IoT SiteWise entrenamiento es una evaluación del rendimiento del modelo en los eventos individuales. Durante el entrenamiento, AWS IoT SiteWise genera una puntuación de anomalías y un diagnóstico de la contribución del sensor para cada fila del conjunto de datos de entrada. Una puntuación de anomalía más alta indica una mayor probabilidad de que se produzca un evento anormal.

Los diagnósticos puntuales están disponibles cuando se entrena un modelo con una ExecuteActionAPI y el tipo de AWS/ANOMALY_DETECTION_TRAINING acción.

Para configurar la evaluación del modelo,

  • Configure su depósito de Amazon S3 de acuerdo con los requisitos previos de etiquetado en Requisitos previos de etiquetado de datos.

  • Añada lo siguiente a. anomaly-detection-training-payload.json

    • Proporcione los datos evaluationStartTime y evaluationEndTime (ambos en segundos de época) en la ventana utilizada para evaluar el rendimiento del modelo.

    • Proporcione la ubicación del depósito de Amazon S3 (resultDestination) para que se escriban los diagnósticos de evaluación.

nota

El intervalo de evaluación del modelo (dataStartTimetodataEndtime) debe superponerse o ser contiguo al intervalo de entrenamiento. No se permiten espacios vacíos.

{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "modelEvaluationConfiguration": { "dataStartTime": evaluationStartTime, "dataEndTime": evaluationEndTime "resultDestination": { "bucketName": "s3BucketName", "prefix": "bucketPrefix" } } }
ejemplo de una configuración de evaluación de modelos:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "modelEvaluationConfiguration": { "dataStartTime": 1722789360, "dataEndTime": 1725174000, "resultDestination": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl" } } }