k-NN 모델 튜닝 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

k-NN 모델 튜닝

Amazon SageMaker AI k-nearest neighbors 알고리즘은 감독 알고리즘입니다. 이 알고리즘은 테스트 데이터세트를 사용하고 분류 작업에 대한 정확도 관련 지표 또는 회귀 작업에 대한 평균 제곱근 오차 관련 지표를 내보냅니다. 이러한 정확도 지표는 경험적 테스트 데이터가 제공하는 실측 정보를 기준으로 각 작업에 대한 모델 예측을 비교합니다. 테스트 데이터세트에 대해 가장 높은 정확도 또는 가장 낮은 오차를 보고하는 최적의 모델을 찾기 위해 k-NN에 대해 하이퍼파라미터 튜닝 작업을 실행할 수 있습니다.

하이퍼파라미터 튜닝이라고도 하는 자동 모델 튜닝은 데이터세트에 대한 광범위한 하이퍼파라미터를 테스트하는 여러 작업을 실행하여 최적의 모델 버전을 찾습니다. 튜닝 가능한 하이퍼파라미터, 각 하이퍼파라미터에 대한 값 범위 및 목표 지표를 선택합니다. 알고리즘의 예측 작업에 적절한 목표 지표를 선택합니다. 자동 모델 튜닝은 선택한 하이퍼파라미터를 검색하여 목표 지표를 최적화하는 모델을 만드는 값 조합을 찾습니다. 이러한 하이퍼파라미터는 예측 모델 파라미터를 지원하기 위한 용도로만 사용하고, 훈련된 모델이 예측을 위해 사용하지 않습니다.

모델 튜닝에 대한 추가 정보는 SageMaker AI를 사용한 자동 모델 튜닝 섹션을 참조하세요.

k-NN 알고리즘으로 계산되는 지표

k-nearest neighbors 알고리즘은 훈련 중 predictor_type 하이퍼파라미터가 지정한 작업 유형에 따라 다음 표에 있는 두 가지 지표 중 하나를 계산합니다.

  • 분류자는 분류 작업을 지정하고 test:accuracy를 계산합니다.

  • regressor는 회귀 작업을 지정하고 test:mse를 계산합니다.

모델 튜닝 시 관련 목표 지표를 계산하기 위해 수행되는 작업 유형에 적절한 predictor_type 값을 선택합니다.

지표 이름 설명 최적화 방향
test:accuracy

predictor_typeclassifier로 설정하면 k-NN은 k-nearest neighbors의 레이블 평균을 기반으로 예측 레이블을 test 채널 데이터에서 제공되는 실측 정보 레이블과 비교합니다. 보고되는 정확도 범위는 0.0(0%)~1.0(100%)입니다.

최대화

test:mse

predictor_typeregressor로 설정하면 k-NN은 k-nearest neighbors의 레이블 평균을 기반으로 예측 레이블을 test 채널 데이터에서 제공되는 실측 정보 레이블과 비교합니다. 평균 제곱근 오차는 두 레이블을 비교해 계산됩니다.

최소화

튜닝 가능한 k-NN 하이퍼파라미터

다음 하이퍼파라미터를 사용하여 Amazon SageMaker AI k-nearest neighbor 모델을 튜닝합니다.

파라미터 이름 파라미터 유형 권장 범위
k

IntegerParameterRanges

MinValue: 1, MaxValue: 1024

sample_size

IntegerParameterRanges

MinValue: 256, MaxValue: 20000000