

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 레이블링
<a name="labeling"></a>

## 명확한 레이블 지정 지침 제공
<a name="instructions"></a>

데이터 세트에는 전체 데이터 세트에서 레이블 지정이 일치하지 않는 모호한 샘플이 포함될 수 있습니다. 예를 들어 개가 포함된 이미지에 레이블을 지정하는 작업을 고려합니다. 일부 샘플에는 동물의 개요만 포함될 수 있습니다. 양수 또는 음수 레이블로 표시해야 합니까? 이러한 유형의 문제는 레이블 지정자에게 명확하고 객관적인 지침을 제공하여 해결할 수 있습니다.

## 과반수 투표 사용
<a name="voting"></a>

이제 *know* and *go*, *shoe* and *two*, *cry* and *high*, *right* and *write* 등 다른 사람과 음성적으로 유사하거나 동일한 단어로 시끄러운 오디오가 포함된 speech-to-text 데이터 세트에 레이블을 지정하는 문제를 고려합니다. 이 경우 레이블 지정자가 이러한 샘플에 일관되지 않게 레이블을 지정할 수 있습니다.

레이블 지정의 정확성을 높이기 위해 일반적인 접근 방식은 여러 작업자에게 동일한 데이터 샘플을 제공하고 결과를 집계하는 과반수 투표를 사용하는 것입니다. 이 방법과 보다 정교한 변형은 블로그 게시물 [ Amazon SageMaker AI Ground Truth로 군중의 지혜를 사용하여 기계 학습 블로그에서 데이터에 보다 정확하게 주석을 달](https://aws.amazon.com/blogs/machine-learning/use-the-wisdom-of-crowds-with-amazon-sagemaker-ground-truth-to-annotate-data-more-accurately/) 수 있습니다. AWS Machine Learning 