레이블링 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

레이블링

명확한 레이블 지정 지침 제공

데이터 세트에는 전체 데이터 세트에서 레이블 지정이 일치하지 않는 모호한 샘플이 포함될 수 있습니다. 예를 들어 개가 포함된 이미지에 레이블을 지정하는 작업을 고려해 보세요. 일부 샘플에는 동물의 개요만 포함될 수 있습니다. 양수 또는 음수 레이블로 표시해야 합니까? 이러한 유형의 문제는 레이블러에 명확하고 객관적인 지침을 제공하여 해결할 수 있습니다.

과반수 투표 사용

이제 know-to-speech-to-text 텍스트 데이터 세트에 레이블을 지정하는 문제를 생각해 보세요. 이 경우 레이블러가 이러한 샘플에 일관되지 않게 레이블을 지정할 수 있습니다.

레이블 지정의 정확성을 높게 유지하기 위해 일반적인 접근 방식은 여러 작업자에게 동일한 데이터 샘플을 제공하고 결과를 집계하는 과반수 투표를 사용하는 것입니다. 이 방법과 보다 정교한 변형은 블로그 게시물에 설명되어 있습니다. Amazon SageMaker AI Ground Truth와 함께 군중의 지혜를 사용하여 기계 학습 블로그에서 데이터에 보다 정확하게 주석을 달 수 있습니다. AWS Machine Learning