

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 데이터 변환
<a name="dw-transform-data"></a>

 Data Wrangler에서 데이터를 변환하려면 데이터 흐름에 **변환** 단계를 추가합니다. Data Wrangler에는 **Personalize용 맵 열** 변환을 포함하여 데이터를 준비하는 데 사용할 수 있는 300개 이상의 변환이 포함되어 있습니다. 또한 일반 Data Wrangler 변환을 사용하여 특이값, 유형 문제, 누락된 값과 같은 문제를 해결할 수 있습니다.

데이터 변환을 완료한 후에는 Data Wrangler로 데이터를 분석할 수 있습니다. 또는 Data Wrangler에서 데이터 준비를 완료한 경우 데이터를 처리하고 Personalize로 가져올 수도 있습니다. 데이터 분석에 대한 자세한 내용은 [시각화 및 데이터 인사이트 생성](dw-analyze-data.md)단원을 참조하세요. 데이터 처리 및 가져오기에 대한 자세한 내용은 [데이터를 처리하고 Personalize로 가져오기](dw-export-data.md)단원을 참조하세요.

**Topics**
+ [Personalize용 매핑 열](#dw-personalize-transform)
+ [일반 Data Wrangler 변환](#dw-general-transform)

## Personalize용 매핑 열
<a name="dw-personalize-transform"></a>

 Personalize 요구 사항을 충족하도록 데이터를 변환하려면 **Personalize용 맵 열** 변환을 추가하고, 열을 Personalize의 필수 및 선택 필드에 매핑합니다.

**Personalize용 맵 열 변환을 사용하려면**

1.  최신 변환의 경우 **\+**를 선택하고 **변환 추가**를 선택합니다. 변환을 추가하지 않은 경우, **데이터 유형** 변환에 대해 **\+**를 선택합니다. Data Wrangler는 이 변환을 흐름에 자동으로 추가합니다.

1.  **단계 추가**를 선택합니다.

1.  **Personalize용 변환**을 선택합니다. **Personalize용 맵 열** 변환은 기본 설정으로 선택됩니다.

1. 변환 필드를 사용하여 데이터를 필수 Personalize 속성에 매핑합니다.

   1. 데이터와 일치하는 데이터세트 유형(상호작용, 항목 또는 사용자)을 선택합니다.

   1. 도메인(ECOMMERCE, VIDEO\_ON\_DEMAND 또는 사용자 지정)을 선택합니다. 선택한 도메인은 데이터세트 그룹을 생성할 때 지정한 도메인과 일치해야 합니다.

   1. Personalize의 필수 및 선택 필드와 일치하는 열을 선택합니다. 예를 들어, item\_ID 열의 경우 각 항목의 고유한 식별 정보를 저장하는 데이터 열을 선택합니다.

      각 열 필드는 데이터 유형에 의해 필터링됩니다. Personalize 데이터 유형 요구 사항을 충족하는 데이터의 열만 사용할 수 있습니다. 데이터가 필수 유형이 아닌 경우, [유형으로 파스 값](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) Data Wrangler 변환을 사용하여 데이터를 변환할 수 있습니다.

## 일반 Data Wrangler 변환
<a name="dw-general-transform"></a>

 다음과 같은 일반 Data Wrangler 변환은 Personalize에 사용할 데이터를 준비하는 데 도움이 될 수 있습니다.
+ 데이터 유형 전환: 필드가 **Personalize용 맵 열** 변환에서 가능한 옵션으로 나열되지 않은 경우, 해당 데이터 유형의 전환이 필요할 수 있습니다. Data Wrangler 변환 [유형으로 파스 값](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) 데이터를 변환하는 데 도움이 될 수 있습니다. 또는 흐름을 생성할 때 Data Wrangler가 기본값으로 추가하는 **데이터 유형** 변환을 사용할 수 있습니다. 이 변환을 사용하려면 **유형** 드롭다운 목록에서 데이터 유형을 선택하고 **미리보기** 선택한 다음 **업데이트**를 선택합니다.

   필드에 필요한 데이터 유형에 대한 자세한 내용은 [Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성](how-it-works-dataset-schema.md)의 도메인 및 데이터세트 유형에 대한 단원을 참조하세요.
+ 결측값 및 특이값 처리: 결측값 또는 특이값 인사이트를 생성하는 경우, Data Wrangler 변환 [특이값 처리](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-outlier) 및 [결측값 처리](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-missing)를 사용하여 이러한 문제를 해결할 수 있습니다.
+  사용자 지정 변환: Data Wrangler를 사용하면 Python(사용자 정의 함수), PySpark, Pandas 또는 PySpark(SQL)를 사용하여 자체 변환을 생성할 수 있습니다. 사용자 지정 변환을 사용하여 중복된 열 삭제 또는 열별로 그룹화 등의 작업을 수행할 수 있습니다. 자세한 내용은 *Amazon SageMaker AI 개발자 안내서*의 [사용자 지정 변환](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-custom)을 참조하세요.