

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 시작하기 전제 조건
<a name="gs-prerequisites"></a>

다음 단계는 시작하기 연습의 전제 조건을 나타냅니다.

1.  Personalize가 사용자를 대신하여 리소스에 액세스할 수 있도록 권한을 설정합니다. 여기에는 Personalize에 대한 서비스 역할을 생성하고 IAM 정책을 통해 Personalize 리소스에 대한 액세스 권한을 부여하는 작업이 포함됩니다. 자세한 내용은 [Personalize에 리소스에 액세스할 수 있는 권한 부여](set-up-required-permissions.md) 섹션을 참조하세요.

1. 학습 데이터를 준비해 데이터를 S3 버킷에 업로드합니다.
   +  도메인 데이터세트 그룹 자습서는 [학습 데이터 생성(도메인 데이터세트 그룹)](#gs-data-prep-domain)단원을 참조하세요.
   +  사용자 지정 데이터세트 그룹 자습서는 [학습 데이터 생성(사용자 지정 데이터세트 그룹)](#gs-upload-to-bucket)단원을 참조하세요.

1.  [Personalize에 S3 리소스에 대한 액세스 권한 부여](granting-personalize-s3-access.md)에 지정된 대로 Personalize 서비스 역할에 S3 리소스에 액세스할 수 있는 권한을 부여합니다.

## 학습 데이터 생성(도메인 데이터세트 그룹)
<a name="gs-data-prep-domain"></a>

학습 데이터를 생성하려면 영화 평점 데이터를 다운로드하여 수정하고 Simple Storage Service(S3) 버킷에 저장합니다. 그런 다음, 버킷에서 읽을 수 있는 권한을 Personalize에 부여합니다.

**학습 데이터를 생성하려면**

1. [MovieLens](https://grouplens.org/datasets/movielens)의 교육 및 개발 추천에 따라 영화 등급 zip 파일인 [ml-latest-small.zip](http://files.grouplens.org/datasets/movielens/ml-latest-small.zip)를 다운로드하고 압축을 풉니다(F. Maxwell Harper 및 Joseph A. Konstan. 2015. The MovieLens Datasets: History and Context. ACM Transactions on Interactive Intelligent Systems(TiiS) 5, 4: 19:1–19:19. https://doi.org/10.1145/2827872).**

1. `ratings.csv` 파일을 엽니다. 이 파일에는 이 자습서의 상호작용 데이터가 들어 있습니다.

   1. 평점 열을 삭제합니다.**

   1. `userId` 및 `movieId`열의 이름을 각각 `USER_ID`및 `ITEM_ID`로 바꿉니다.

   1. EVENT\$1TYPE 열을 추가하고 모든 레코드의 값을 `watch`로 설정합니다. Microsoft Excel을 사용하는 경우 열의 첫 번째 셀에 `watch`을 입력한 다음 셀의 오른쪽 하단 모서리를 두 번 클릭하여 모든 레코드에 대해 EVENT\$1TYPE을 설정할 수 있습니다. 헤더가 다음과 같아야 합니다.

      **USER\$1ID,ITEM\$1ID,TIMESTAMP,EVENT\$1TYPE**

      Personalize가 데이터를 인식하려면 이 열이 표시된 것과 정확히 일치해야 합니다. 데이터의 처음 몇 줄은 다음과 같은 형식이어야 합니다.

      ```
      USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE
      1,1,964982703,watch
      1,3,964981247,watch
      1,6,964982224,watch
      1,47,964983815,watch
      1,50,964982931,watch
      ....
      ....
      ```

   `ratings.csv` 파일을 저장합니다.

1. S3 버킷에 `ratings.csv`을 업로드합니다. 자세한 내용은 Simple Storage Service 사용 설명서의 [드래그 앤 드롭을 사용하여 파일 및 폴더 업로드](https://docs.aws.amazon.com/AmazonS3/latest/user-guide/upload-objects.html) 단원을 참조하세요.

1. Personalize에 버킷의 데이터를 읽을 수 있는 권한을 부여합니다. 자세한 내용은 [Personalize에 S3 리소스에 대한 액세스 권한 부여](granting-personalize-s3-access.md)단원을 참조하세요.

## 학습 데이터 생성(사용자 지정 데이터세트 그룹)
<a name="gs-upload-to-bucket"></a>

학습 데이터를 생성하려면 영화 평점 데이터를 다운로드하여 수정하고 Simple Storage Service(S3) 버킷에 저장합니다. 그런 다음, 버킷에서 읽을 수 있는 권한을 Personalize에 부여합니다.

1. [MovieLens](https://grouplens.org/datasets/movielens)의 교육 및 개발 추천에 따라 영화 등급 zip 파일인 [ml-latest-small.zip](http://files.grouplens.org/datasets/movielens/ml-latest-small.zip)를 다운로드하고 압축을 풉니다(F. Maxwell Harper 및 Joseph A. Konstan. 2015. The MovieLens Datasets: History and Context. ACM Transactions on Interactive Intelligent Systems(TiiS) 5, 4: 19:1–19:19. https://doi.org/10.1145/2827872).**

1. `ratings.csv` 파일을 엽니다. 이 파일에는 이 자습서의 상호작용 데이터가 들어 있습니다.

   1. 평점 열을 삭제합니다.**

   1. 헤더 행을 다음으로 바꿉니다.

      **USER\$1ID,ITEM\$1ID,TIMESTAMP**

      Personalize가 데이터를 인식하려면 이 헤더가 표시된 것과 정확히 일치해야 합니다.

   `ratings.csv` 파일을 저장합니다.

1. S3 버킷에 `ratings.csv`을 업로드합니다. 자세한 내용은 Simple Storage Service 사용 설명서의 [드래그 앤 드롭을 사용하여 파일 및 폴더 업로드](https://docs.aws.amazon.com/AmazonS3/latest/user-guide/upload-objects.html) 단원을 참조하세요.

1. Personalize에 버킷의 데이터를 읽을 수 있는 권한을 부여합니다. 자세한 내용은 [Personalize에 S3 리소스에 대한 액세스 권한 부여](granting-personalize-s3-access.md) 섹션을 참조하세요.