

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 사용자 데이터 세트 스키마 요구 사항(사용자 지정)
<a name="user-dataset-requirements"></a>

 사용자 데이터세트는 사용자에 대한 메타데이터를 저장합니다.** 여기에는 각 항목에 대한 연령, 성별, 로열티 멤버십과 같은 정보가 포함될 수 있습니다. Personalize로 가져올 수 있는 사용자 데이터 유형에 대한 자세한 내용은 [사용자 메타데이터](users-datasets.md)단원을 참조하세요.

 각 사용자에 제공하는 데이터는 스키마와 일치해야 합니다. 최소한 각 사용자의 사용자 ID(최대 길이 256자)를 제공해야 합니다. 스키마에 따라 사용자 메타데이터에는 비어 있음/null 값이 포함될 수 있습니다. 사용자 스키마에는 최소 하나 이상의 메타데이터 필드가 있어야 하지만 `null`유형을 추가할 경우 사용자에 대해 이 값이 null이 될 수 있습니다. 사용 사례와 데이터에 따라 추가 필드를 마음대로 추가할 수 있습니다. 필드가 필수 또는 예약으로 나열되어 있지 않고 데이터 유형이 [스키마 데이터 유형](how-it-works-dataset-schema.md#personalize-datatypes)에 나열된 경우, 필드 이름과 데이터 사용자가 선택할 수 있습니다.

 범주형 데이터를 사용하려면 스키마에서 유형 `string`필드를 추가하고 필드의 범주형 속성을 `true`로 설정합니다. 그런 다음 대량 CSV 파일 및 개별 항목 가져오기에 범주형 데이터를 포함합니다. 여러 범주를 갖는 개인 사용자의 경우, 세로 막대 '\|'를 사용하여 각 값을 구분합니다. 예를 들어, SUBSCRIPTION\_MODEL 필드의 경우 사용자에 대한 데이터는 학생\|월별\|할인이 될 수 있습니다.

범주형 값은 최대 1000자까지 포함할 수 있습니다. 범주형 값이 1000자를 초과하는 사용자가 있는 경우, 데이터세트 가져오기 작업이 실패합니다.

사용자 데이터세트에 대한 최소 요구 사항 및 최대 데이터 한도에 대한 자세한 내용은 [Service Quotas](limits.md#limits-table)단원을 참조하세요.

## 사용자 스키마 예제(사용자 지정)
<a name="schema-examples-users"></a>

다음 예제에서는 사용자 스키마를 조직하는 방법을 보여줍니다. `USER_ID` 필드는 필수 필드이고 `AGE`및 `GENDER`필드는 메타데이터입니다. 하나 이상의 메타데이터 필드가 필요하며 최대 25개의 메타데이터 필드를 추가할 수 있습니다. 스키마 요구 사항에 대한 자세한 내용은 [사용자 지정 데이터세트 및 스키마 요구 사항](custom-datasets-and-schemas.md#dataset-requirements)단원을 참조하세요.

```
{
  "type": "record",
  "name": "Users",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
      {
          "name": "USER_ID",
          "type": "string"
      },
      {
          "name": "AGE",
          "type": "int"
      },
      {
          "name": "GENDER",
          "type": "string",
          "categorical": true
      }
  ],
  "version": "1.0"
}
```

이 스키마의 경우, CSV 파일의 이력 데이터의 처음 몇 줄은 다음과 같을 수 있습니다.

```
USER_ID,AGE,GENDER
5,34,Male
6,56,Female
8,65,Male
...
...
```