

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 시각화 및 데이터 인사이트 생성
<a name="dw-analyze-data"></a>

데이터를 Data Wrangler로 가져온 후 이를 사용하여 시각화 및 데이터 인사이트를 생성할 수 있습니다.
+  **[시각화](#dw-visualizing-data)**: Data Wrangler는 히스토그램, 스캐터 차트 등 다양한 유형의 그래프를 생성할 수 있습니다. 예를 들어, 히스토그램을 생성하여 데이터의 특이값을 식별할 수 있습니다.
+ **[데이터 인사이트](#dw-generating-insights)**: Personalize의 데이터 품질 및 인사이트 보고서를 사용하여 데이터 인사이트와 열 및 행 통계를 통해 데이터에 대해 학습할 수 있습니다.** 이 보고서를 통해 데이터에 유형 문제가 있는지 알 수 있습니다. 또한 데이터를 개선하기 위해 어떤 조치를 취할 수 있는지 학습할 수 있습니다. 이러한 조치는 모델 교육 요구 사항과 같은 Personalize 리소스 요구 사항을 충족하는 데 도움을 줄 수 있거나 추천을 개선할 수 있습니다.

 시각화와 인사이트를 통해 데이터에 대해 학습하게 되면 이 정보를 사용하여 추가 변환을 적용하여 데이터를 개선할 수 있습니다. 또는 데이터 준비를 완료한 경우 데이터를 처리하고 Personalize로 가져올 수도 있습니다. 데이터 변환에 대한 자세한 내용은 [데이터 변환](dw-transform-data.md)단원을 참조하세요. 데이터 처리 및 가져오기에 대한 자세한 내용은 [데이터를 처리하고 Personalize로 가져오기](dw-export-data.md)단원을 참조하세요.

## 시각화 생성
<a name="dw-visualizing-data"></a>

Data Wrangler를 사용하여 히스토그램, 스캐터 차트 등 다양한 유형의 그래프를 생성할 수 있습니다. 예를 들어, 히스토그램을 생성하여 데이터의 특이값을 식별할 수 있습니다. 데이터 시각화를 생성하려면 흐름에 **분석** 단계를 추가하고 **분석 유형**에서 생성하려는 시각화를 선택합니다.

 Data Wrangler에서 시각화를 생성하는 방법에 대한 자세한 내용은 *Amazon SageMaker AI 개발자 안내서*의 [분석 및 시각화](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-analyses.html)를 참조하세요.

## 데이터 인사이트 생성
<a name="dw-generating-insights"></a>

 Data Wrangler를 사용하여 데이터세트 유형에 맞는 **Personalize용 데이터 품질 및 인사이트 보고서**를 생성할 수 있습니다. 보고서를 생성하기 전에 Personalize 요구 사항을 충족하도록 데이터를 변환하는 것이 좋습니다. 이렇게 하면 보다 관련성이 높은 인사이트를 얻을 수 있습니다. 자세한 내용은 [데이터 변환](dw-transform-data.md)단원을 참조하세요.

**Topics**
+ [보고서 콘텐츠](#dw-report-content)
+ [보고서 생성](#dw-generating-insight-report)

### 보고서 콘텐츠
<a name="dw-report-content"></a>

**Personalize용 데이터 품질 및 인사이트 보고서**에는 다음 단원이 포함됩니다.
+ **요약:** 보고서 요약에는 데이터세트 통계와 우선순위가 높은 경고가 포함됩니다.
  + **데이터세트 통계:** 여기에는 Personalize의 특정 통계(예: 상호작용 데이터의 고유 사용자의 수) 및 일반 통계(예: 누락된 값 또는 특이값의 수)가 포함됩니다.
  +  **우선 순위가 높은 경고:** 교육 또는 추천에 가장 큰 영향을 미치는 Personalize의 특정 인사이트입니다. 각 경고에는 문제를 해결하기 위해 취할 수 있는 권장 조치가 포함되어 있습니다.
+  **중복된 행 및 불완전한 행:** 이들 단원에는 누락된 값이 있는 행과 데이터에서 중복된 행에 대한 정보가 포함되어 있습니다.
+  **특성 요약:** 이 단원에는 각 열의 데이터 유형, 유효하지 않거나 누락된 데이터 정보, 경고 개수가 포함되어 있습니다.
+  **특성 세부 정보:** 이 단원에는 각 데이터 열에 대한 세부 정보가 포함된 하위 단원이 포함되어 있습니다. 각 하위 단원에는 범주형 값의 수, 누락값 정보와 같은 열에 대한 통계가 포함되어 있습니다. 그리고 각 하위 단원에는 데이터 열에 대한 Personalize의 특정 인사이트와 권장 조치가 포함되어 있습니다. 예를 들어, 한 열에 30개 이상의 범주가 있다는 인사이트가 표시될 수 있습니다.

#### 데이터 유형 문제
<a name="dw-report-type-issues"></a>

 보고서는 데이터 유형이 올바르지 않은 열을 식별하고 필수 유형을 지정합니다. 이러한 특성과 관련된 인사이트를 얻으려면 열의 데이터 유형을 변환하고 보고서를 다시 생성해야 합니다. 유형을 전환하려면 Data Wrangler 변환 [유형으로 파스 값](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type)을 사용할 수 있습니다.

#### Personalize 인사이트
<a name="dw-report-insights"></a>

Personalize 인사이트에는 조사 결과와 제안된 조치가 포함됩니다. 이 조치는 선택 사항입니다. 예를 들어, 보고서에는 범주형 데이터 열에 대한 범주의 수와 관련된 인사이트와 조치가 포함될 수 있습니다. 열이 범주형이라고 생각하지 않으면 이 통계를 무시하고 어떤 조치도 취하지 않아도 됩니다.

 사소한 표현의 차이를 제외하고, Personalize의 특정 인사이트는 Personalize로 데이터를 분석할 때 생성할 수 있는 단일 데이터세트 인사이트와 동일합니다.** 예를 들어, Data Wrangler의 인사이트 보고서에는 “항목 상호 작용 데이터 세트에 상호 작용이 2번 이상 있는 순 사용자가 X명뿐입니다."와 같은 인사이트가 포함되어 있습니다. 하지만 “*항목 데이터 세트*에 있는 항목 중 X%에 *항목 상호 작용 데이터 세트*에서 상호 작용이 없음"과 같은 인사이트는 포함되지 않습니다.

 가능한 Personalize의 특정 인사이트 목록은 [데이터 인사이트](analyzing-data.md#data-insights)에서 여러 데이터세트를 참조하지 않는 인사이트를 참조하세요.

#### 보고서 예
<a name="dw-insight-report-examples"></a>

Personalize 보고서의 모양과 느낌은 Data Wrangler의 일반 인사이트 보고서와 동일합니다. 일반 인사이트 보고서의 예는 *Amazon SageMaker AI 개발자 안내서*의 [데이터 및 데이터 품질에 대한 인사이트 얻기](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-data-insights.html) 를 참조하세요. 다음 예제는 항목 상호 작용 데이터 세트에 대한 보고서의 요약 섹션을 보여줍니다. 여기에는 데이터 세트 통계와 우선순위가 높을 수 있는 몇 가지 항목 상호 작용 데이터 세트 경고가 포함됩니다.

![항목 상호 작용 데이터세트에 대한 보고서의 요약 섹션을 보여줍니다.](http://docs.aws.amazon.com/ko_kr/personalize/latest/dg/images/dw-reports-summary.png)


 다음 예제는 항목 상호 작용 데이터 세트의 EVENT\_TYPE 열에 대한 특성 세부 정보 섹션이 보고서에 어떻게 표시되는지 보여줍니다.

![항목 상호 작용 데이터세트의 EVENT_TYPE 열에 대한 기능 세부 정보 섹션을 보여줍니다.](http://docs.aws.amazon.com/ko_kr/personalize/latest/dg/images/dw-event-type-report.png)


### 보고서 생성
<a name="dw-generating-insight-report"></a>

**Personalize용 데이터 품질 및 인사이트 보고서**를 생성하려면 변환에 대한 **데이터 인사이트 얻기**를 선택하고 분석을 생성합니다.

**Personalize용 데이터 품질 및 인사이트 보고서를 생성하려면**

1. 분석 중인 변환에 대해 **\+** 옵션을 선택합니다. 변환을 추가하지 않은 경우, **데이터 유형** 변환에 대해 **\+**를 선택합니다. Data Wrangler는 이 변환을 흐름에 자동으로 추가합니다.

1. **데이터 인사이트 얻기**를 선택합니다. **분석 생성** 패널이 표시됩니다.

1. **분석 유형**의 경우 **Personalize용 데이터 품질 및 인사이트 보고서**를 선택합니다.

1.  **데이터세트 유형**의 경우 분석 중인 Personalize 데이터세트의 유형을 선택합니다.

1. 원하는 대로 **전체 데이터에 대해 실행**을 선택합니다. 기본 설정으로 Data Wrangler는 데이터 샘플에 대한 인사이트만 생성합니다.

1. **생성(Create)**을 선택합니다. 분석이 완료되면 보고서가 표시됩니다.