기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
모범 사례
최소 날짜 범위 이해
훈련 데이터 기간에는 최소 14일을 사용합니다. 그러나 대부분의 경우 더 긴 기간의 데이터를 포함하는 것이 좋습니다.
훈련 데이터 세트가 모든 정상 작동 모드에서 자산이 작동하는 기간에 걸쳐 있는지 확인합니다. 이 접근 방식은 예상 동작과 실제 이상을 AWS IoT SiteWise 정확하게 구분하는 데 도움이 됩니다.
훈련 데이터가 모든 일반적인 작동 모드를 나타내지 않는 경우 익숙하지 않지만 정상적인 패턴을 이상으로 잘못 플래그 지정하여 오탐지가 증가할 AWS IoT SiteWise 수 있습니다.
훈련과 추론 간의 높은 빈도의 데이터 및 일관성 샘플링
센서가 1Hz보다 높은 주파수(초당 읽기 1회 이상)에서 데이터를 생성하는 경우 훈련 중에 샘플링을 적용합니다. 샘플링은 데이터 볼륨을 줄이는 동시에 필수 추세를 보존하여 효율적인 처리를 가능하게 하고 노이즈 또는 일시적 변동의 영향을 최소화하여 모델 일반화를 개선합니다.
AWS IoT SiteWise 네이티브 이상 탐지는 현재 1Hz 미만의 속도로 수집된 데이터를 지원하지 않습니다. 이상 탐지를 구성하기 전에 데이터가이 최소 빈도 요구 사항을 충족하는지 확인합니다.
또한 추론을 위한 훈련 중에 구성하는 샘플링 속도도 AWS IoT SiteWise 사용합니다. 일관성을 유지하고 정확한 이상 탐지 결과를 보장하려면 운영 요구 사항과 센서 데이터의 동작 모두에 맞는 샘플링 속도를 선택합니다.
에서 샘플링 속도를 설정하는 방법에 대한 자세한 내용을 알아봅니다샘플 속도 구성.
레이블 지정 권장 사항
효과적인 모델 평가 및 지속적인 개선에는 정확하고 일관된 이상 레이블 지정이 필수적입니다. 이상에 레이블을 지정할 때는 다음 모범 사례를 고려하세요.
-
관련 이상 항목 통합: 긴밀하게 발생하는 이상이 동일한 기본 문제의 일부인 경우 별도의 이벤트로 레이블을 지정하지 마세요. 예를 들어, 이상이 서로 1~2일 이내에 발생하고 동일한 근본 원인이 이를 유도하는 경우 이를 단일 이상 기간으로 취급합니다. 이 접근 방식은 모델이 비정상적인 동작의 패턴을 더 잘 학습하고 평가 데이터의 노이즈를 줄이는 데 도움이 됩니다.
-
지점뿐만 아니라 이상 윈도우에 레이블 지정: 개별 데이터 포인트를 이상으로 표시하는 대신 편차 발생부터 복구까지 비정상적인 동작을 반영하는 전체 윈도우에 레이블을 지정합니다. 이 접근 방식은 더 명확한 경계를 제공하고 실제 운영 문제에 맞게 모델 조정을 개선합니다.
-
불확실한 기간 제외: 기간이 변칙적인지 확실하지 않은 경우 레이블을 지정하지 않은 상태로 둡니다. 모호한 레이블은 모델을 혼동하고 시간이 지남에 따라 정확도를 저하시킬 수 있습니다.
에서 레이블을 추가하는 방법에 대한 자세한 내용을 알아봅니다데이터에 레이블 지정.