

Kami tidak lagi memperbarui layanan Amazon Machine Learning atau menerima pengguna baru untuk itu. Dokumentasi ini tersedia untuk pengguna yang sudah ada, tetapi kami tidak lagi memperbaruinya. Untuk informasi selengkapnya, lihat [Apa itu Amazon Machine Learning](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html).

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Langkah 2: Buat Datasource Pelatihan
<a name="step-2-create-a-datasource"></a>

Setelah mengunggah `banking.csv` kumpulan data ke lokasi Amazon Simple Storage Service (Amazon S3), Anda menggunakannya untuk membuat sumber data pelatihan. Sumber data adalah objek Amazon Machine Learning (Amazon ML) yang berisi lokasi data input dan metadata penting tentang data input Anda. Amazon ML menggunakan sumber data untuk operasi seperti pelatihan dan evaluasi model ML.

Untuk membuat sumber data, berikan yang berikut ini: 
+  Lokasi Amazon S3 dari data Anda dan izin untuk mengakses data 
+  Skema, yang mencakup nama-nama atribut dalam data dan jenis setiap atribut (Numerik, Teks, Kategori, atau Biner) 
+  Nama atribut yang berisi jawaban yang Anda ingin Amazon ML pelajari untuk memprediksi, atribut target 

**catatan**  
Sumber data tidak benar-benar menyimpan data Anda, itu hanya mereferensikannya. Hindari memindahkan atau mengubah file yang disimpan di Amazon S3. Jika Anda memindahkan atau mengubahnya, Amazon ML tidak dapat mengaksesnya untuk membuat model ML, menghasilkan evaluasi, atau menghasilkan prediksi.

**Untuk membuat sumber data pelatihan**

1. Buka konsol Amazon Machine Learning di [https://console.aws.amazon.com/machinelearning/](https://console.aws.amazon.com/machinelearning/).

1.  Pilih **Mulai**. 
**catatan**  
Tutorial ini mengasumsikan bahwa ini adalah pertama kalinya Anda menggunakan Amazon ML. Jika Anda pernah menggunakan Amazon ML sebelumnya, Anda dapat menggunakan **Create new...** daftar drop-down di dasbor Amazon Amazon untuk membuat sumber data baru.

1. Pada halaman **Memulai Amazon Machine Learning**, pilih **Luncurkan**.   
![\[Amazon Machine Learning interface with "Launch" button highlighted for standard setup.\]](http://docs.aws.amazon.com/id_id/machine-learning/latest/dg/images/get-started-launch.png)

1. Pada halaman **Input Data**, untuk **Di mana data Anda berada**? , pastikan bahwa **S3** dipilih.   
![\[Radio button selection between S3 and Redshift options, with S3 selected.\]](http://docs.aws.amazon.com/id_id/machine-learning/latest/dg/images/image5.png)

1. Untuk **Lokasi S3**, ketik lokasi lengkap `banking.csv ` file dari Langkah 1: Siapkan Data Anda. Sebagai contoh: *your-bucket***/banking.csv**. Amazon MLmenambahkan s3://ke nama bucket Anda untuk Anda.

1. Untuk **nama Datasource**, ketik. **Banking Data 1**  
![\[S3 location input field and Datasource name field for entering banking data information.\]](http://docs.aws.amazon.com/id_id/machine-learning/latest/dg/images/image6.png)

1. Pilih **Verifikasi**. 

1. **Di kotak dialog **izin S3**, pilih Ya.**   
![\[Dialog box asking to grant Amazon Machine Learning read permission for S3 location.\]](http://docs.aws.amazon.com/id_id/machine-learning/latest/dg/images/image7.png)

1.  Jika Amazon ML dapat mengakses dan membaca file data di lokasi S3, Anda akan melihat halaman yang mirip dengan berikut ini. Tinjau properti, lalu pilih **Lanjutkan**.   
![\[Validation success message with datasource details including name, location, and file information.\]](http://docs.aws.amazon.com/id_id/machine-learning/latest/dg/images/image8.png)

Selanjutnya, Anda membuat skema. *Skema* adalah informasi yang dibutuhkan Amazon MLL untuk menafsirkan data input untuk model ML, termasuk nama atribut dan tipe data yang ditetapkan, dan nama atribut khusus. Ada dua cara untuk menyediakan Amazon ML dengan skema: 
+  Berikan file skema terpisah saat Anda mengunggah data Amazon S3 Anda. 
+  Izinkan Amazon ML menyimpulkan jenis atribut dan membuat skema untuk Anda. 

Dalam tutorial ini, kita akan meminta Amazon ML untuk menyimpulkan skema. 

Untuk informasi tentang membuat file skema terpisah, lihat[Membuat Skema Data untuk Amazon ML](creating-a-data-schema-for-amazon-ml.md). 

**Untuk memungkinkan Amazon ML menyimpulkan skema**

1. Pada halaman **Skema**, Amazon ML menunjukkan skema yang disimpulkan. Tinjau tipe data yang disimpulkan Amazon ML untuk atribut. Penting bahwa atribut diberikan tipe data yang benar untuk membantu Amazon ML mencerna data dengan benar dan untuk mengaktifkan pemrosesan fitur yang benar pada atribut.
   + Atribut yang hanya memiliki dua kemungkinan status, seperti ya atau tidak, harus ditandai sebagai **Biner**. 
   + **Atribut yang merupakan angka atau string yang digunakan untuk menunjukkan kategori harus ditandai sebagai Kategoris.**
   + Atribut yang merupakan besaran numerik yang urutannya bermakna harus ditandai sebagai **Numerik**.
   + **Atribut yang merupakan string yang ingin Anda perlakukan sebagai kata yang dibatasi oleh spasi harus ditandai sebagai Teks.**  
![\[Data table showing fields like age, campaign, and contact with their data types and sample values.\]](http://docs.aws.amazon.com/id_id/machine-learning/latest/dg/images/image10.png)

1. Dalam tutorial ini, Amazon ML telah mengidentifikasi tipe data untuk semua atribut dengan benar, jadi pilih **Lanjutkan**. 

Selanjutnya, pilih atribut target. 

Ingatlah bahwa targetnya adalah atribut yang harus dipelajari oleh model ML untuk diprediksi. Atribut **y** menunjukkan apakah seseorang telah berlangganan kampanye di masa lalu: 1 (ya) atau 0 (tidak). 

**catatan**  
Pilih atribut target hanya jika Anda akan menggunakan sumber data untuk melatih dan mengevaluasi model ML.

**Untuk memilih y sebagai atribut target**

1. Di kanan bawah tabel, pilih panah tunggal untuk maju ke halaman terakhir tabel, di mana atribut bernama `y` muncul.   
![\[Navigation buttons for a paginated table, with the last page arrow highlighted.\]](http://docs.aws.amazon.com/id_id/machine-learning/latest/dg/images/image11.png)

1. Di kolom **Target**, pilih`y`.   
![\[Checkbox in Target column next to variable 'y' with Binary data type.\]](http://docs.aws.amazon.com/id_id/machine-learning/latest/dg/images/image12.png)

   Amazon ML mengonfirmasi bahwa **y** dipilih sebagai target Anda. 

1. Pilih **Lanjutkan**. 

1. Pada halaman **ID Baris**, untuk **Apakah data Anda berisi pengenal?** , pastikan bahwa **Tidak**, default, dipilih. 

1. Pilih **Review**, lalu pilih **Continue**. 

Sekarang setelah Anda memiliki sumber data pelatihan, Anda siap untuk [membuat](step-3-create-an-ml-model.md) model Anda.