기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
노트북 인스턴스를 사용하여 모델을 빌드하기 위한 자습서
이 시작하기 자습서는 SageMaker 노트북 인스턴스를 생성하고, 기계 학습을 위한 Conda 환경에서 사전 구성된 커널로 Jupyter Notebook을 열고, SageMaker AI 세션을 시작하여 엔드투엔드 ML 주기를 실행하는 방법을 안내합니다. SageMaker AI 세션과 자동으로 페어링되는 기본 Amazon S3 버킷에 데이터세트를 저장하고, ML 모델의 훈련 작업을 Amazon EC2에 제출하고, Amazon EC2를 통한 호스팅 또는 배치 추론을 통해 예측용으로 훈련된 모델을 배포하는 방법을 알아봅니다.
이 자습서에서는 SageMaker AI 내장 모델 풀에서 XGBoost 모델을 훈련하는 전체 ML 흐름을 명시적으로 보여줍니다. 미국 성인 인구 조사 데이터세트
-
SageMaker AI XGBoost – XGBoost
모델은 SageMaker AI 환경에 맞게 조정되었으며 Docker 컨테이너로 사전 구성되었습니다. SageMaker AI는 SageMaker AI 기능을 사용하기 위해 준비된 내장 알고리즘 제품군을 제공합니다. SageMaker AI에 적용할 수 있는 ML 알고리즘에 대해 자세히 알아보려면 알고리즘 선택 및 Amazon SageMaker 기본 제공 알고리즘 사용을 참조하세요. SageMaker AI 내장 알고리즘 API 작업에 대한 내용은 Amazon SageMaker Python SDK 의 First-Party Algorithms 을 참조하세요. -
성인 인구 조사 데이터 집합
- Ronny Kohavi와 Barry Becker(데이터 마이닝 및 시각화, Silicon Graphics)가 작성한1994년 인구조사국 데이터베이스 의 데이터 집합입니다. SageMaker AI XGBoost 모델은 이 데이터세트를 사용하여 개인의 연간 수입이 5만 USD 이상인지 또는 그 미만인지 예측하도록 훈련됩니다.