

Não estamos mais atualizando o serviço Amazon Machine Learning nem aceitando novos usuários para ele. Essa documentação está disponível para usuários existentes, mas não estamos mais atualizando-a. Para obter mais informações, consulte [O que é o Amazon Machine Learning](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html).

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Etapa 1: Preparar os dados
<a name="step-1-download-edit-and-upload-data"></a>

Em Machine Learning, você geralmente obtém os dados e garante que seu formato é válido antes de iniciar o processo de treinamento. Para fins deste tutorial, obtivemos um conjunto de dados de amostra no [UCI Machine Learning Repository](http://archive.ics.uci.edu/ml/), formatamos esse conjunto e dados de acordo com as diretrizes do Amazon ML e os disponibilizamos para download. Faça download do conjunto de dados no local de armazenamento do Amazon Simple Storage Service (Amazon S3) e faça upload para seu próprio bucket do S3 seguindo os procedimentos deste tópico.

 Para obter os requisitos de formatação do Amazon ML, consulte [Noções básicas sobre o formato de dados para Amazon ML](understanding-the-data-format-for-amazon-ml.md).

**Para fazer download dos conjuntos de dados**

1. Faça download do arquivo que contém os dados históricos dos clientes que compraram produtos semelhantes ao seu depósito bancário de longo prazo clicando em [banking.zip](samples/banking.zip). Descompacte a pasta e salve o arquivo banking.csv no computador.

1. Faça download do arquivo que você usará para prever se os clientes em potencial responderão à oferta clicando em [banking-batch.zip](samples/banking-batch.zip). Descompacte a pasta e salve o arquivo banking-batch.csv no computador.

1.  Abra o `banking.csv`. Você verá linhas e colunas de dados. A *linha do cabeçalho* contém os nomes dos atributos de cada coluna. Um *atributo* é uma propriedade exclusiva nomeada que descreve uma característica específica de cada cliente, por exemplo, nr\_employed indica o status de contratação do cliente. Cada linha representa a coleção de observações sobre um único cliente.   
![Arquivo CSV mostrando a linha do cabeçalho com os nomes das colunas euribor3m, nr_employed e y acima das linhas de dados.](http://docs.aws.amazon.com/pt_br/machine-learning/latest/dg/images/image1.png)

   Você quer que o modelo de ML responda à pergunta "O cliente se inscreverá no meu novo produto?". No conjunto de dados `banking.csv`, a resposta a essa pergunta é o atributo **y**, que contém os valores 1 (para sim) ou 0 (para não). O atributo que você deseja que o Amazon ML saiba como prever é chamado de *atributo de destino*. 
**nota**  
O atributo **y** é um atributo binário. Ele pode conter apenas um dos dois valores, neste caso, 0 ou 1. No conjunto de dados UCI original, o atributo **y** é Sim ou Não. Editamos o conjunto de dados original para você. Agora, todos os valores do atributo **y** que significam sim são 1, e todos os valores que significam não são 0. Se você usar seus próprios dados, poderá usar outros valores para um atributo binário. Para obter mais informações sobre valores válidos, consulte [Usando o AttributeType campo](creating-a-data-schema-for-amazon-ml.md#assigning-data-types).

 Os exemplos a seguir mostram os dados antes e depois que alteramos os valores do atributo **y** para os atributos binários 0 e 1. 

![Arquivo CSV mostrando as colunas euribor3m e nr_employed com valores y transformados de para. yes/no 1/0](http://docs.aws.amazon.com/pt_br/machine-learning/latest/dg/images/image2.png)


![Transformação de dados mostrando o arquivo banking.csv com as colunas euribor3m, nr_employed e y exibidas.](http://docs.aws.amazon.com/pt_br/machine-learning/latest/dg/images/image3.png)


 O arquivo `banking-batch.csv` não contém o atributo **y**. Após criar um modelo de ML, você o usará para prever **y** para cada registro nesse arquivo. 

 Em seguida, faça upload dos arquivos `banking.csv ` e `banking-batch.csv` para o Amazon S3. 

**Para fazer upload dos arquivos para um local do Amazon S3**

1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon S3 em. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1.  Na lista **All Buckets (Todos os buckets)**, crie um bucket ou escolha o local onde você deseja fazer upload dos arquivos.

1. Na barra de navegação, escolha **Upload (Fazer upload)**. 

1. Escolha **Adicionar arquivos**. 

1.  Na caixa de diálogo, navegue até a área de trabalho, escolha `banking.csv` e `banking-batch.csv` e escolha **Open (Abrir)**. 

 Agora, você está pronto para [criar a fonte de dados de treinamento](step-2-create-a-datasource.md). 