

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 데이터 준비
<a name="canvas-data-prep"></a>

**참고**  
이전에는 Amazon SageMaker Data Wrangler가 SageMaker Studio Classic 경험에 포함되어 있었습니다. 이제 새 Studio 경험으로 업데이트하는 경우 SageMaker Canvas를 사용하여 Data Wrangler에 액세스하고 최신 기능 업데이트를 받아야 합니다. 지금까지 Studio Classic에서 Data Wrangler를 사용하고 Canvas의 Data Wrangler로 마이그레이션하려는 경우 Canvas 애플리케이션을 만들고 사용할 수 있도록 추가 권한을 부여해야 할 수 있습니다. 자세한 내용은 [(선택 사항) Studio Classic의 Data Wrangler에서 SageMaker Canvas로 마이그레이션](studio-updated-migrate-ui.md#studio-updated-migrate-dw) 섹션을 참조하세요.  
Studio Classic의 Data Wrangler에서 데이터 흐름을 마이그레이션하는 방법을 알아보려면 [(선택 사항) Studio Classic에서 Studio로 데이터 마이그레이션](studio-updated-migrate-data.md) 섹션을 참조하세요.

Amazon SageMaker Canvas의 Amazon SageMaker Data Wrangler를 사용하여 데이터를 준비, 특성화 및 분석할 수 있습니다. 사용자는 Data Wrangler 데이터 준비 플로우를 기계 학습(ML) 워크플로에 통합하여 코딩을 거의 또는 전혀 사용하지 않고도 데이터 사전 처리 및 특성 추출을 단순화하고 간소화할 수 있습니다. 나만의 Python 스크립트와 변환을 추가하여 워크플로를 사용자 지정할 수도 있습니다.
+ **데이터 플로우** - 데이터 플로우를 생성하여 일련의 ML 데이터 준비 단계를 정의합니다. 사용자는 플로우를 사용하여 다양한 데이터 소스의 데이터세트를 결합하고, 데이터세트에 적용할 변환의 수와 유형을 식별하고, ML 파이프라인에 통합할 수 있는 데이터 준비 워크플로를 정의할 수 있습니다.
+ **변환** - 문자열, 벡터, 숫자 데이터 형식 지정 도구와 같은 표준 변환을 사용하여 데이터세트를 정리하고 변환합니다.** 텍스트, 날짜/시간 임베딩, 범주형 인코딩과 같은 변환을 사용하여 데이터를 특징화할 수 있습니다.
+ **데이터 인사이트 생성** - Data Wrangler 데이터 품질 및 인사이트 보고서를 사용하여 데이터 품질을 자동으로 확인하고 데이터의 이상 항목을 감지합니다.
+ **분석** - 플로우의 어느 시점에서든 데이터세트의 특징을 분석할 수 있습니다. Data Wrangler에는 산점 및 히스토그램과 같은 기본 제공 데이터 시각화 도구뿐만 아니라 대상 누 분석 및 특징 상관 관계를 파악하기 위한 빠른 모델링과 같은 데이터 분석 도구가 포함되어 있습니다.
+ **내보내기** - 데이터 준비 워크플로를 다른 위치로 내보냅니다. 다음은 예제 위치입니다.
  + Amazon Simple Storage Service(S3) 버킷
  + Amazon SageMaker Feature Store - 기능과 해당 데이터를 중앙 집중식 스토어에 저장합니다.
+ **데이터 준비 자동화** - 데이터 흐름에서 기계 학습 워크플로를 만듭니다.
  + Amazon SageMaker Pipelines - SageMaker AI 데이터 준비, 모델 훈련 및 모델 배포 작업을 관리하는 워크플로를 구축합니다.
  + 직렬 추론 파이프라인 - 데이터 흐름에서 직렬 추론 파이프라인을 만듭니다. 이를 사용하여 새 데이터를 예측합니다.
  + Python 스크립트 - 사용자 지정 워크플로를 위해 데이터와 해당 변환을 Python 스크립트에 저장합니다.