기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
모델 성능 지표
모델 훈련이 완료되면 Amazon Fraud Detector는 모델 훈련에 사용되지 않은 데이터의 15%를 사용하여 모델 성능을 검증합니다. 훈련된 Amazon Fraud Detector 모델은 검증 성능 지표와 유사한 실제 사기 탐지 성능을 가질 것으로 예상할 수 있습니다.
기업으로서 더 많은 사기를 탐지하고 합법적인 고객에게 마찰을 더하는 것 사이의 균형을 맞춰야 합니다. Amazon Fraud Detector는 올바른 밸런스를 선택하는 데 도움이 되도록 모델 성능을 평가하는 다음과 같은 도구를 제공합니다.
-
점수 분포 차트 - 모델 점수 분포의 히스토그램은 100,000개의 이벤트로 구성된 예제 모집단을 가정합니다. 왼쪽 Y축은 합법적인 이벤트를 나타내고 오른쪽 Y축은 사기 이벤트를 나타냅니다. 차트 영역을 클릭하여 특정 모델 임계값을 선택할 수 있습니다. 그러면 혼동 행렬 및 ROC 차트의 해당 뷰가 업데이트됩니다.
-
혼동 행렬 - 모델 예측과 실제 결과를 비교하여 지정된 점수 임계값에 대한 모델 정확도를 요약합니다. Amazon Fraud Detector는 100,000개의 이벤트로 구성된 예제 모집단을 가정합니다. 사기 및 합법적인 이벤트의 배포는 비즈니스의 사기율을 시뮬레이션합니다.
참 긍정 - 모델은 사기를 예측하고 이벤트는 실제로 사기입니다.
거짓 긍정 - 모델은 사기를 예측하지만 이벤트는 실제로 합법적입니다.
참 부정 - 모델은 합법적이고 이벤트는 실제로 합법적임을 예측합니다.
거짓 부정 - 모델은 합법적이라고 예측하지만 실제로는 이벤트가 사기입니다.
-
참 긍정률(TPR) - 모델이 탐지한 총 사기의 비율입니다. 캡처 속도라고도 합니다.
-
FPR(False positive rate) - 사기로 잘못 예측된 총 합법적인 이벤트의 비율입니다.
-
수신기 연산자 곡선(ROC) - 가능한 모든 모델 점수 임계값에 대해 거짓 긍정 비율의 함수로 실제 긍정 비율을 표시합니다. 고급 지표를 선택하여이 차트를 봅니다.
-
곡선하 면적(AUC) - 가능한 모든 모델 점수 임계값에서 TPR 및 FPR을 요약합니다. 예측력이 없는 모델은 AUC가 0.5인 반면, 완벽한 모델은 점수가 1.0입니다.
-
불확실성 범위 - 모델에서 예상되는 AUC 범위를 보여줍니다. 범위가 클수록(AUC > 0.1의 상한 및 하한 차이) 모델 불확실성이 높아집니다. 불확실성 범위가 크면(>0.1) 레이블이 더 많은 이벤트를 제공하고 모델을 재학습하는 것이 좋습니다.
모델 성능 지표를 사용하려면
-
점수 분포 차트부터 시작하여 사기 및 합법적인 이벤트에 대한 모델 점수 분포를 검토합니다. 이상적으로는 사기와 합법적인 이벤트가 명확하게 구분됩니다. 이는 모델이 사기성 이벤트와 합법적인 이벤트를 정확하게 식별할 수 있음을 나타냅니다. 차트 영역을 클릭하여 모델 임계값을 선택합니다. 모델 점수 임계값을 조정하면 실제 긍정 및 거짓 긍정 비율에 어떤 영향을 미치는지 확인할 수 있습니다.
참고
점수 분포 차트는 사기와 합법적인 이벤트를 서로 다른 두 Y축에 표시합니다. 왼쪽 Y축은 합법적인 이벤트를 나타내고 오른쪽 Y축은 사기 이벤트를 나타냅니다.
-
혼동 행렬을 검토합니다. 선택한 모델 점수 임계값에 따라 100,000개의 이벤트 샘플을 기반으로 시뮬레이션된 영향을 볼 수 있습니다. 사기 및 합법적인 이벤트의 배포는 비즈니스의 사기율을 시뮬레이션합니다. 이 정보를 사용하여 참 긍정 비율과 거짓 긍정 비율 간의 적절한 균형을 찾을 수 있습니다.
-
자세한 내용을 보려면 고급 지표를 선택합니다. ROC 차트를 사용하여 모델 점수 임계값에 대한 참 긍정 비율과 거짓 긍정 비율 간의 관계를 이해합니다. ROC 곡선은 참 긍정 비율과 거짓 긍정 비율 간의 균형을 미세 조정하는 데 도움이 될 수 있습니다.
참고
테이블을 선택하여 테이블 형식의 지표를 검토할 수도 있습니다.
테이블 보기에는 지표 정밀도도 표시됩니다. 정밀도는 사기로 예측된 모든 이벤트와 비교하여 사기로 정확하게 예측된 사기 이벤트의 백분율입니다.
-
성능 지표를 사용하여 목표 및 사기 탐지 사용 사례에 따라 비즈니스에 최적의 모델 임계값을 결정합니다. 예를 들어 모델을 사용하여 새 계정 등록을 고위험, 중간 또는 저위험으로 분류하려는 경우 다음과 같이 세 가지 규칙 조건의 초안을 작성할 수 있도록 두 개의 임계값 점수를 식별해야 합니다.
-
점수 > X는 위험이 높습니다.
-
점수 < X이지만 > Y는 중간 위험입니다.
-
점수가 < Y이면 위험이 낮습니다.
-