As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configurações avançadas de treinamento
Configuração da taxa de amostragem
A taxa de amostragem define a frequência com que as leituras do sensor são registradas (por exemplo, uma vez a cada segundo ou uma vez a cada minuto). Essa configuração afeta diretamente a granularidade dos dados de treinamento e influencia a capacidade do modelo de capturar variações de curto prazo no comportamento do sensor.
Visite Amostragem para dados de alta frequência e consistência entre treinamento e inferência para saber mais sobre as melhores práticas.
Configurar a taxa de amostragem alvo
Opcionalmente, você pode especificar a TargetSamplingRate
em sua configuração de treinamento para controlar a frequência com que os dados são amostrados. Os valores compatíveis são:
PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
Esses são formatos de duração ISO 8601, representando os seguintes formatos de hora:
-
PT1S
= 1 segundo -
PT1M
= 1 minuto -
PT1H
= 1 hora
Escolha uma taxa de amostragem que atinja o equilíbrio certo entre resolução de dados e eficiência do treinamento. As seguintes tarifas estão disponíveis:
-
Taxas de amostragem mais altas (
PT1S
) oferecem detalhes mais precisos, mas podem aumentar o volume de dados e o tempo de treinamento. -
Taxas de amostragem mais baixas (
PT10M
,PT1H
) reduzem o tamanho e o custo dos dados, mas podem ignorar anomalias de curta duração.
Lidando com o desalinhamento do timestamp
AWS IoT SiteWise compensa automaticamente o desalinhamento do timestamp em vários fluxos de dados durante o treinamento. Isso garante um comportamento consistente do modelo, mesmo que os sinais de entrada não estejam perfeitamente alinhados no tempo.
Visite Amostragem para dados de alta frequência e consistência entre treinamento e inferência para saber mais sobre as melhores práticas.
Ativar amostragem
Adicione o código a seguir anomaly-detection-training-payload.json
a.
Configure a amostragem adicionando TargetSamplingRate
a carga útil da ação de treinamento, com a taxa de amostragem dos dados. Os valores permitidos são:PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
.
{ "exportDataStartTime": StartTime, "exportDataEndTime": EndTime, "targetSamplingRate": "TargetSamplingRate" }
exemplo de uma configuração de taxa de amostragem:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "targetSamplingRate": "PT1M" }
Rotule seus dados
Ao rotular seus dados, você deve definir intervalos de tempo que representem períodos de comportamento anormal do equipamento. Essas informações de rotulagem são fornecidas como um CSV
arquivo, onde cada linha especifica um intervalo de tempo durante o qual o equipamento não estava operando corretamente.
Cada linha contém dois carimbos de data/hora:
-
A hora de início, indicando quando se acredita que um comportamento anormal tenha começado.
-
A hora de término, representando quando a falha ou problema foi observado pela primeira vez.
Esse arquivo CSV é armazenado em um bucket do Amazon S3 e é usado durante o treinamento do modelo para ajudar o sistema a aprender com exemplos conhecidos de comportamento anormal. O exemplo a seguir mostra como os dados da etiqueta devem aparecer como um .csv
arquivo. O arquivo não tem cabeçalho.
exemplo de um arquivo CSV:
2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000 2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000 2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000
A linha 1 representa um evento de manutenção em 21 de junho de 2024, com uma janela de 12 horas (de 2024-06-21T00:00:00.000000Z
até2024-06-21T12:00:00.000000Z
) AWS IoT SiteWise para procurar comportamentos anormais.
A linha 2 representa um evento de manutenção em 11 de julho de 2024, com uma janela de 12 horas (de 2024-07-11T00:00:00.000000Z
até2024-07-11T12:00:00.000000Z
) AWS IoT SiteWise para procurar comportamentos anormais.
A linha 3 representa um evento de manutenção em 31 de julho de 2024, com uma janela de 12 horas (de 2024-07-31T00:00:00.000000Z
até2024-07-31T12:00:00.000000Z
) AWS IoT SiteWise para procurar comportamentos anormais.
AWS IoT SiteWise usa todas essas janelas de tempo para treinar e avaliar modelos que podem identificar comportamentos anormais em torno desses eventos. Observe que nem todos os eventos são detectáveis e os resultados são altamente dependentes da qualidade e das características dos dados subjacentes.
Para obter detalhes sobre as melhores práticas de amostragem, consultePráticas recomendadas.
Etapas de marcação de dados
-
Faça upload do arquivo em seu balde de etiquetagem.
-
Adicione o seguinte
anomaly-detection-training-payload.json
a.-
Forneça os locais na
labelInputConfiguration
seção do arquivo.labels-bucket
Substitua pelo nome do bucket efiles-prefix
pelo caminho do (s) arquivo (s) ou por qualquer parte do prefixo. Todos os arquivos no local são analisados e (em caso de sucesso) usados como arquivos de etiquetas.
-
{ "exportDataStartTime":
StartTime
, "exportDataEndTime":EndTime
, "labelInputConfiguration": { "bucketName": "label-bucket
", "prefix": "files-prefix
" } }
exemplo de uma configuração de etiqueta:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "labelInputConfiguration": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv" } }
Avaliar seu modelo
O diagnóstico pontual do modelo para um modelo de AWS IoT SiteWise treinamento é uma avaliação do desempenho do modelo em eventos individuais. Durante o treinamento, AWS IoT SiteWise gera uma pontuação de anomalia e diagnósticos de contribuição do sensor para cada linha no conjunto de dados de entrada. Uma pontuação de anomalia mais alta indica uma maior probabilidade de um evento anormal.
Diagnósticos pontuais estão disponíveis quando você treina um modelo com ExecuteActionAPI e tipo de AWS/ANOMALY_DETECTION_TRAINING
ação.
Para configurar a avaliação do modelo,
-
Adicione o seguinte
anomaly-detection-training-payload.json
a.-
Forneça o
evaluationStartTime
eevaluationEndTime
(ambos em segundos de época) para os dados na janela usada para avaliar o desempenho do modelo. -
Forneça a localização do bucket do Amazon S3 (
resultDestination
) para que o diagnóstico de avaliação seja gravado.
-
nota
O intervalo de avaliação do modelo (dataStartTime
todataEndtime
) deve se sobrepor ou ser contíguo ao intervalo de treinamento. Nenhuma lacuna é permitida.
{ "exportDataStartTime":
StartTime
, "exportDataEndTime":EndTime
, "modelEvaluationConfiguration": { "dataStartTime":evaluationStartTime
, "dataEndTime":evaluationEndTime
"resultDestination": { "bucketName": "s3BucketName
", "prefix": "bucketPrefix
" } } }
exemplo de uma configuração de avaliação do modelo:
{ "exportDataStartTime": 1717225200, "exportDataEndTime": 1722789360, "modelEvaluationConfiguration": { "dataStartTime": 1722789360, "dataEndTime": 1725174000, "resultDestination": { "bucketName": "anomaly-detection-customer-data-278129555252-iad", "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl" } } }