

# 2단계: Amazon EMR 클러스터 시작
<a name="EMRforDynamoDB.Tutorial.LaunchEMRCluster"></a>

이 단계에서는 Amazon EMR 클러스터를 구성하고 시작합니다. Hive와 DynamoDB용 스토리지 핸들러는 이미 클러스터에 설치되어 있을 것입니다.

1. [https://console.aws.amazon.com/emr](https://console.aws.amazon.com/emr/)에서 Amazon EMR 콘솔을 엽니다.

1. **Create Cluster**를 선택합니다.

1. **Create Cluster - Quick Options** 페이지에서 다음을 수행합니다.

   1. **Cluster name**에 클러스터 이름을 입력합니다(예: `My EMR cluster`).

   1. **EC2 key pair**에서 앞서 생성한 키 페어를 선택합니다.

   기타 설정은 기본값을 유지합니다.

1. **클러스터 생성**을 선택합니다.

클러스터를 시작하는 데 몇 분이 걸릴 수 있습니다. Amazon EMR 콘솔의 **Cluster Details(클러스터 세부 정보)** 페이지에서 진행 상황을 모니터링할 수 있습니다.

`Waiting` 상태로 변경된 이후에 클러스터를 사용할 수 있습니다.

## 클러스터 로그 파일 및 Amazon S3
<a name="EMRforDynamoDB.Tutorial.LaunchEMRCluster.LogFilesAndS3"></a>

Amazon EMR 클러스터는 클러스터 상태 정보와 디버깅 정보를 포함하는 로그 파일을 생성합니다. **Create Cluster - Quick Options(클러스터 생성 - 빠른 옵션)**의 기본 설정에는 Amazon EMR 로깅 설정이 포함됩니다.

없는 경우 AWS Management Console에서 Amazon S3 버킷을 생성합니다. 버킷 이름은 `aws-logs-account-id-region`이며, 여기에서 ` account-id`는 AWS 계정 번호, `region`은 클러스터를 시작한 리전입니다(예: `aws-logs-123456789012-us-west-2`).

**참고**  
Amazon S3 콘솔을 사용하여 로그 파일을 볼 수 있습니다. 자세한 내용은 *Amazon EMR 관리 가이드*의 [로그 파일 보기](https://docs.aws.amazon.com/ElasticMapReduce/latest/ManagementGuide/emr-manage-view-web-log-files.html) 단원을 참조하세요.

이 버킷을 로깅 이외에 용도로 사용할 수 있습니다. 예를 들어, 버킷을 Hive 스크립트를 저장하기 위한 위치로 사용하거나 Amazon DynamoDB에서 Amazon S3로 데이터를 내보낼 때 대상으로 사용할 수 있습니다.

**다음 단계**  
[3단계: 리더 노드에 연결](EMRforDynamoDB.Tutorial.ConnectToLeaderNode.md)