기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# k-means 하이퍼파라미터
<a name="k-means-api-config"></a>

[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html) 요청에서 사용하고자 하는 훈련 알고리즘을 지정합니다. 알고리즘별 하이퍼파라미터를 문자열-문자열 맵으로 지정할 수 있습니다. 다음 테이블에는 Amazon SageMaker AI에서 제공되는 k-means 훈련 알고리즘에 대한 하이퍼파라미터가 나열되어 있습니다. k-means 클러스터링 작동 방식에 대한 자세한 정보는 [k-means 클러스터링 작동 방식](algo-kmeans-tech-notes.md) 섹션을 참조하세요.


| 파라미터 이름 | 설명 | 
| --- | --- | 
| feature\_dim | 입력 데이터의 특징 수.<br />**필수**<br />유효한 값: 양수 | 
| k | 필요한 클러스터 수.<br />**필수**<br />유효한 값: 양수 | 
| epochs | 훈련 데이터에 대한 전달 횟수.<br />**선택 사항**<br />유효한 값: 양수<br />기본값: 1 | 
| eval\_metrics | 모델에 대한 점수를 보고하는 데 사용되는 지표 유형의 JSON 목록. 허용되는 값은 평균 제곱 편차의 경우 `msd`이고, 제곱 거리의 합의 경우 `ssd`입니다. 테스트 데이터가 제공된 경우에는 요청된 각 지표에 대해 점수가 보고됩니다.<br />**선택 사항**<br />유효한 값: `[\"msd\"]`, `[\"ssd\"]` 또는 `[\"msd\",\"ssd\"]`.<br />기본값: `[\"msd\"]` | 
| extra\_center\_factor | 이 알고리즘은 실행 시 K 중심 = `num_clusters` \* `extra_center_factor`를 생성하고 모델 완료 시 중심 수를 K에서 `k`로 줄입니다.<br />**선택 사항**<br />유효한 값: 양의 정수 또는 `auto`.<br />기본값: `auto` | 
| half\_life\_time\_size | 클러스터 평균을 계산할 때 관측치에 지정할 가중치를 결정하는 데 사용됩니다. 더 많은 지점을 관측할수록 가중치는 급격하게 감소합니다. 지점이 처음으로 관측되는 경우 클러스터 평균을 계산할 때 해당 지점에는 가중치 1이 할당됩니다. `half_life_time_size` 지점을 관측한 이후 가중치는 1/2이 되도록 지수 감소 함수의 감소 상수를 선택합니다. 0으로 설정된 경우 감퇴가 없습니다.<br />**선택 사항**<br />유효한 값: 음수가 아닌 정수<br />기본값: 0 | 
| init\_method | 이 알고리즘이 초기 클러스터 중심을 선택하는 메서드. 표준 k-means 접근 방식은 이러한 메서드를 무작위로 선택합니다. 대체 k-means\+\+ 메서드는 첫 번째 클러스터 중심을 무작위로 선택합니다. 그런 다음 기존 중심에서 남은 데이터 포인트까지 거리의 제곱에 비례하는 가능성 분포로 중심 선택에 가중치를 부여해 초기 클러스터의 위치를 분산시킵니다.<br />**선택 사항**<br />유효한 값: `random` 또는 `kmeans++`.<br />기본값: `random` | 
| local\_lloyd\_init\_method | `k` 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저에 대한 초기화 메서드.<br />**선택 사항**<br />유효한 값: `random` 또는 `kmeans++`.<br />기본값: `kmeans++` | 
| local\_lloyd\_max\_iter | `k` 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저에 대한 최대 반복 횟수.<br />**선택 사항**<br />유효한 값: 양수<br />기본값: 300 | 
| local\_lloyd\_num\_trials | `k` 중심이 포함된 최종 모델을 빌드하는 경우 손실이 가장 낮은 Lloyd의 Expectation–Maximization(EM) 프로시저가 실행되는 횟수.<br />**선택 사항**<br />유효한 값: 양의 정수 또는 `auto`.<br />기본값: `auto` | 
| local\_lloyd\_tol | `k` 중심이 포함된 최종 모델을 빌드하기 위해 사용되는 Lloyd의 Expectation–Maximization(EM) 프로시저의 조기 중지에 대한 손실 변화 내결함성.<br />**선택 사항**<br />유효한 값: 부동 소수점. 범위: [0, 1].<br />기본값: 0.0001 | 
| mini\_batch\_size | 데이터 반복자의 미니 배치당 관측치의 수.<br />**선택 사항**<br />유효한 값: 양수<br />기본값: 5000 |