

# Etapa 2: iniciar um cluster do Amazon EMR
<a name="EMRforDynamoDB.Tutorial.LaunchEMRCluster"></a>

Nesta etapa, você irá configurar e iniciar um cluster do Amazon EMR. O Hive e um handler de armazenamento para DynamoDB já estarão instalados no cluster.

1. Abra o console do Amazon EMR em [https://console.aws.amazon.com/emr](https://console.aws.amazon.com/emr/).

1. Selecione **Create Cluster (Criar cluster)**.

1. Na página **Create Cluster - Quick Options**, faça o seguinte:

   1. Em **Cluster name**, digite um nome para o seu cluster (por exemplo: `My EMR cluster`).

   1. Em **EC2 key pair**, escolha o par de chaves que você criou mais cedo.

   Deixe as outras configurações nos valores padrão.

1. Selecione **Criar cluster**.

Vários minutos serão necessários para o cluster ser iniciado. Você pode usar a página **Cluster Details** (Detalhes do cluster) no console do Amazon EMR para monitorar seu progresso.

Quando o status mudar para `Waiting`, o cluster estará pronto para uso.

## Arquivos de log do cluster e Amazon S3
<a name="EMRforDynamoDB.Tutorial.LaunchEMRCluster.LogFilesAndS3"></a>

Um cluster do Amazon EMR gera arquivos de log que contêm informações sobre o status do cluster e as informações de depuração. As configurações padrão de **Create Cluster – Quick Options** (Criar cluster – Opções rápidas) incluem a configuração do registro em log do Amazon EMR.

O Console de gerenciamento da AWS criará um bucket do Amazon S3, caso ainda não exista um. O nome do bucket é `aws-logs-account-id-region`, onde ` account-id` é o número da sua conta da AWS e `region` é a região em que você iniciou o cluster (por exemplo, `aws-logs-123456789012-us-west-2`).

**nota**  
Você pode usar o console do Amazon S3 para visualizar os arquivos de log. Para obter mais informações, consulte [Visualizar arquivos de log](https://docs.aws.amazon.com/ElasticMapReduce/latest/ManagementGuide/emr-manage-view-web-log-files.html) no *Guia de gerenciamento do Amazon EMR*.

Você pode usar esse bucket para outras finalidades, além do log. Por exemplo, você pode usar o bucket como um local para armazenar um script do Hive ou como um destino ao exportar dados do Amazon DynamoDB para o Amazon S3.

**Próxima etapa**  
[Etapa 3: conectar ao nó líder](EMRforDynamoDB.Tutorial.ConnectToLeaderNode.md)