기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 학습을 위한 사용자 메타데이터 준비
<a name="users-datasets"></a>

 Amazon Personalize로 가져올 수 있는 사용자 데이터에는 사용자 연령 같은 수치적 데이터와 성별 또는 로열티 멤버십과 같은 범주형 메타데이터가 포함됩니다. 사용자에 대한 메타데이터를 Personalize 사용자 데이터세트로 가져옵니다.**

도메인 사용 사례 또는 사용자 지정 레시피에 따라 사용자 메타데이터는 Amazon Personalize가 사용자에게 더 관련성이 높은 항목을 추천하거나 더 의미 있는 사용자 세그먼트를 추천하는 데 도움이 될 수 있습니다. 또한 학습 후에는 모델이 상호 작용 데이터가 없는 사용자에게 항목을 추천하는 데 도움이 될 수 있습니다. 사용자 메타데이터를 사용하는 사용 사례 또는 레시피에 대한 자세한 내용은 [사용 사례를 Amazon Personalize 리소스와 일치시킵니까?](use-cases-and-recipes.md)에서 도메인 사용 사례 또는 레시피에 대한 데이터 요구 사항을 참조하세요.

 학습 시 Amazon Personalize는 사용자 이름, 사용자에 대한 키워드 또는 태그와 같은 범주형이 아닌 문자열 사용자 데이터를 사용하지 않습니다. 그러나 이 데이터를 가져오더라도 추천 사항이 향상될 수 있습니다. 자세한 내용은 [비범주형 문자열 데이터](#user-string-data) 섹션을 참조하세요.

모든 도메인 사용 사례 및 사용자 지정 레시피의 경우 대량 사용자 데이터는 CSV 파일에 있어야 합니다. 파일의 각 행은 고유한 사용자를 나타내야 합니다. 데이터 준비를 마치면 스키마 JSON 파일을 생성할 준비가 된 것입니다. 이 파일은 Amazon Personalize에 데이터 구조에 대해 알려줍니다. 자세한 내용은 [Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성](how-it-works-dataset-schema.md) 섹션을 참조하세요.

다음 섹션에서는 Amazon Personalize를 위해 사용자 데이터를 준비하는 방법에 대한 자세한 정보를 제공합니다. 모든 유형의 데이터에 대한 대량 데이터 형식 지침은 [대량 데이터 형식 지침](preparing-training-data.md#general-formatting-guidelines)을 참조하세요.

**Topics**
+ [사용자 데이터 요구 사항](#user-data-requirements)
+ [범주형 메타데이터](#user-categorical-data)
+ [비범주형 문자열 데이터](#user-string-data)
+ [사용자 메타데이터 예제](#users-data-example)

## 사용자 데이터 요구 사항
<a name="user-data-requirements"></a>

 다음은 Amazon Personalize에 대한 사용자 데이터 요구 사항입니다. 사용 사례와 데이터에 따라 추가 사용자 지정 열을 추가할 수 있습니다.
+ 데이터에는 각 사용자의 고유 식별자를 저장하는 USER\$1ID 열이 있어야 합니다. 모든 사용자에게는 사용자 ID가 있어야 합니다. 최대 길이가 256자인 `string`이어야 합니다.
+ 데이터에는 범주형 문자열 또는 숫자형 메타데이터 열이 하나 이상 있어야 합니다. 사용자 메타데이터 열에는 일부 사용자의 빈 값/널 값이 포함될 수 있습니다. 이러한 열은 최소 70% 이상 완성하는 것이 좋습니다.
+ 최대 메타데이터 열 수는 25개입니다.

충분한 데이터가 있는지 확실하지 않거나 품질에 대한 의문이 있는 경우 데이터를 Amazon Personalize 데이터세트로 가져와서 Amazon Personalize를 사용하여 분석할 수 있습니다. 자세한 내용은 [Amazon Personalize 데이터세트에서 데이터의 품질 및 양 분석](analyzing-data.md) 섹션을 참조하세요.

## 범주형 메타데이터
<a name="user-categorical-data"></a>

일부 레시피와 모든 도메인 사용 사례를 사용할 경우 Amazon Personalize는 사용자에게 가장 관련성이 높은 항목을 나타내는 기본 패턴을 식별할 때 사용자의 성별, 관심사 또는 멤버십 상태와 같은 범주형 메타데이터를 사용합니다. 사용 사례를 기반으로 자체 값 범위를 직접 정의합니다. 범주형 메타데이터는 어떤 언어로든 사용할 수 있습니다.

여러 범주를 갖는 사용자의 경우, 세로 막대 '\$1'를 사용하여 각 값을 구분합니다. 예를 들어 INTERESTS 필드의 경우 사용자에 대한 데이터가 `Movies|TV Shows|Music`일 수 있습니다.

모든 레시피와 도메인으로 범주형 메타데이터를 가져와서 사용자의 속성에 따라 추천을 필터링하는 데 사용할 수 있습니다. 추천 필터링에 대한 자세한 내용은 [추천 및 사용자 세그먼트 필터링](filter.md)단원을 참조하세요.

범주형 값은 최대 1000자까지 포함할 수 있습니다. 범주형 값이 1000자를 초과하는 사용자가 있는 경우, 데이터세트 가져오기 작업이 실패합니다.

## 비범주형 문자열 데이터
<a name="user-string-data"></a>

 사용자 ID를 제외하고 Amazon Personalize는 사용자 이름, 사용자에 대한 키워드 또는 태그와 같은 비범주형 문자열 데이터를 학습할 때 사용하지 않습니다. 하지만 Amazon Personalize는 추천 사항을 필터링할 때 이를 사용할 수 있습니다. (CurrentUser)에 대한 추천을 받으려는 사용자에 대해 비범주형 문자열 데이터를 기반으로 항목을 추천에 포함하거나 추천에서 제거하는 필터를 생성할 수 있습니다. 필터에 대한 자세한 내용은 섹션을 참조하세요[추천 및 사용자 세그먼트 필터링](filter.md) 비범주형 값은 최대 1000자까지 입력할 수 있습니다.

## 사용자 메타데이터 예제
<a name="users-data-example"></a>

CSV 파일의 처음 몇 줄의 사용자 메타데이터는 다음과 같을 수 있습니다.

```
USER_ID,AGE,GENDER,INTEREST
5,34,Male,hiking
6,56,Female,music
8,65,Male,movies|TV shows|music
...
...
```

`USER_ID` 열은 필수이며 각 개별 사용자에 대한 고유 식별자를 저장합니다. `AGE` 열은 숫자형 메타데이터입니다. `GENDER` 및 `INTEREST` 열은 각 사용자에 대한 범주형 메타데이터를 저장합니다.

데이터 준비를 마치면 스키마 JSON 파일을 생성할 준비가 된 것입니다. 이 파일은 Amazon Personalize에 데이터 구조에 대해 알려줍니다. 자세한 내용은 [Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성](how-it-works-dataset-schema.md) 섹션을 참조하세요. 위 샘플 데이터에 대한 스키마 JSON 파일은 다음과 같습니다.

```
{
  "type": "record",
  "name": "Users",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
      {
          "name": "USER_ID",
          "type": "string"
      },
      {
          "name": "AGE",
          "type": "int"
      },
      {
          "name": "GENDER",
          "type": "string",
          "categorical": true
      },
      {
          "name": "INTEREST",
          "type": "string",
          "categorical": true
      }
  ],
  "version": "1.0"
}
```