Amazon SageMaker JumpStart 텍스트 분류 모델 평가 및 비교 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker JumpStart 텍스트 분류 모델 평가 및 비교

SageMaker AI JumpStart는 텍스트를 사전 정의된 클래스로 분류하는 여러 텍스트 분류 모델을 제공합니다. 이러한 모델은 감정 분석, 주제 분류 및 콘텐츠 조정과 같은 작업을 처리합니다. 프로덕션에 적합한 모델을 선택하려면 정확도, F1 점수 및 Matthews 상관관계 계수(MCC)를 비롯한 주요 지표를 사용하여 신중하게 평가해야 합니다.

이 안내서에서 사용자는 다음을 수행합니다.

  • JumpStart 카탈로그에서 여러 텍스트 분류 모델(DistilBERT 및 BERT)을 배포합니다.

  • 균형 잡힌 데이터세트, 왜곡된 데이터세트 및 까다로운 데이터세트에서 포괄적인 평가를 실행합니다.

  • Matthews 상관관계 계수(MCC) 및 rea Under the Curve Receiver Operating Characteristic 점수를 포함한 고급 지표를 해석합니다.

  • 체계적인 비교 프레임워크를 사용하여 데이터에 기반해 모델을 선택합니다.

  • 오토 스케일링 및 CloudWatch 모니터링을 사용하여 프로덕션 배포를 설정합니다.

전체 평가 프레임워크인 JumpStart 모델 평가 패키지를 다운로드합니다. 패키지에는 샘플 출력과 함께 사전 실행 결과가 포함되어 있으므로 모델을 직접 배포하기 전에 평가 프로세스 및 지표를 미리 볼 수 있습니다.

사전 조건

시작하기 전에 다음 사항을 갖췄는지 확인하세요.

시간 및 비용: 총 45분. 비용은 인스턴스 유형 및 사용 기간에 따라 다릅니다. 현재 요금은 SageMaker AI Pricing을 참조하세요.

이 자습서에는 모든 리소스를 제거하고 요금이 지속적으로 발생하는 것을 방지하는 데 도움이 되는 단계별 정리 지침이 포함되어 있습니다.