Práticas recomendadas - AWS IoT SiteWise

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Práticas recomendadas

Entenda o intervalo mínimo de datas

Use um mínimo de 14 dias para a duração dos dados de treinamento. No entanto, recomendamos que você inclua um período maior de dados em muitos casos.

Certifique-se de que seu conjunto de dados de treinamento abranja um período durante o qual o ativo operou em todos os seus modos operacionais normais. Essa abordagem ajuda a distinguir AWS IoT SiteWise com precisão entre o comportamento esperado e as verdadeiras anomalias.

Se seus dados de treinamento não representarem todos os modos operacionais típicos, AWS IoT SiteWise poderá sinalizar incorretamente padrões desconhecidos, mas normais, como anomalias, o que aumenta os falsos positivos.

Amostragem para dados de alta frequência e consistência entre treinamento e inferência

Se seus sensores gerarem dados em uma frequência superior a 1 Hz (mais de uma leitura por segundo), aplique a amostragem durante o treinamento. A amostragem reduz o volume de dados enquanto preserva as tendências essenciais, o que permite um processamento eficiente e melhora a generalização do modelo, minimizando o impacto do ruído ou das flutuações transitórias.

AWS IoT SiteWise A detecção nativa de anomalias atualmente não suporta dados ingeridos em taxas abaixo de 1 Hz. Verifique se seus dados atendem a esse requisito de frequência mínima antes de configurar a detecção de anomalias.

Além disso, também AWS IoT SiteWise usa a taxa de amostragem que você configura durante o treinamento para inferência. Para manter a consistência e garantir resultados precisos de detecção de anomalias, escolha uma taxa de amostragem que se alinhe às suas necessidades operacionais e ao comportamento dos dados do sensor.

Encontre mais detalhes sobre como definir a taxa de amostragem emConfiguração da taxa de amostragem.

Recomendações de rotulagem

A rotulagem precisa e consistente das anomalias é essencial para a avaliação eficaz do modelo e a melhoria contínua. Considere as seguintes práticas recomendadas ao rotular anomalias:

  • Consolide anomalias relacionadas: não rotule anomalias próximas como eventos separados, se elas fizerem parte do mesmo problema subjacente. Por exemplo, se as anomalias ocorrerem dentro de 1 a 2 dias uma da outra e a mesma causa raiz as motivar, trate-as como uma única janela de anomalia. Essa abordagem ajuda o modelo a aprender melhor o padrão de comportamento anormal e reduz o ruído nos dados de avaliação.

  • Identifique janelas de anomalias, não apenas pontos: em vez de marcar pontos de dados individuais como anômalos, rotule a janela inteira que reflete um comportamento anormal desde o início do desvio até a recuperação. Essa abordagem fornece limites mais claros e melhora o alinhamento do modelo com os problemas operacionais reais.

  • Exclua períodos incertos: se você não tiver certeza se um período é anômalo, deixe-o sem rótulo. Rótulos ambíguos podem confundir o modelo e degradar sua precisão ao longo do tempo.

Encontre mais detalhes sobre como adicionar rótulos emRotule seus dados.