기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
글로벌 해석 가능성
특징이 모델 출력에 전반적으로 어떻게 기여하는지 이해하면 특징 선택 및 모델 개발에 유용한 일반적인 통찰력을 얻을 수 있습니다. 새 기능 추가의 효과를 측정하려면 일반적으로 기능을 사용하거나 사용하지 않고 교차 검증을 실행합니다. 그러나 고려 중인 모든 기능 조합과 모든 모델 유형에 대해 교차 검증을 실행하는 것은 계산 비용 때문에 실행 불가능한 경우가 많습니다. 따라서 특징 중요도를 결정하는 다른 방법도 빠른 결정을 내리는 데 유용합니다. 글로벌 기능 속성을 결정할 때는 모든 데이터에 대해 이전 섹션에서 권장하는 로컬 기능 속성 점수를 집계하는 것이 좋습니다. 또한 시간 및 계산상의 제약이 허용하는 경우 기능이 제거되었을 때 교차 검증 점수의 변화를 계산하는 것이 좋습니다. 다음 예시는 로컬 어트리뷰션 점수의 집계를 보여줍니다. 홍채 분류 모델에 대한 SHAP 값의 크기(개요 참조)의 평균을 구하여 히트맵으로 표시합니다. 꽃받침 측정값은 모델에서 홍채 등급을 결정하는 데 큰 역할을 하지 않는다는 것을 알 수 있습니다.
지정된 모델 출력의 경우, 평가 인스턴스 전반의 SHAP 값 모음을 다음 다이어그램에 나와 있는 것처럼(홍채 데이터세트[4]의 데이터 하위 집합에 대해) Beeswarm 플롯으로 시각화할 수 있습니다. 여기서 petal_width 속성이 클래스의 모델 출력에 가장 큰 영향을 미치고 petal_width 값이 높으면 클래스 Iris-versicolor 예측에 부정적인 영향을 미친다는 것을 알 수 있습니다. 특징 속성 값이 같거나 매우 유사한 데이터 포인트가 두 개 이상이면 점을 누적하여 해당 위치의 유병률이 더 높음을 나타냅니다.