

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Mempersiapkan data pelatihan untuk Amazon Personalize
<a name="preparing-training-data"></a>

Setelah Anda [memilih kasus penggunaan domain atau resep](use-cases-and-recipes.md) dan mencatat persyaratan datanya, Anda siap untuk mulai menyiapkan data Anda. Amazon Personalize dapat menggunakan jenis data berikut:
+ [**Interaksi item**](interactions-datasets.md) — Di Amazon Personalize, *interaksi item* adalah peristiwa interaksi positif antara pengguna dan item di katalog Anda. Misalnya, pengguna menonton film, melihat daftar, atau membeli sepasang sepatu.
+ [**Item**](items-datasets.md) — Metadata item mungkin mencakup informasi seperti harga, jenis SKU, deskripsi, atau ketersediaan untuk setiap item dalam katalog Anda.
+ [**Pengguna**](users-datasets.md) — Metadata pengguna dapat mencakup informasi seperti usia, jenis kelamin, keanggotaan loyalitas, dan minat untuk setiap pengguna Anda.
+ [**Tindakan**](actions-datasets.md) — *Tindakan* adalah aktivitas keterlibatan yang mungkin ingin Anda rekomendasikan kepada pelanggan Anda. Tindakan mungkin termasuk menginstal aplikasi seluler Anda, melengkapi profil keanggotaan, bergabung dengan program loyalitas Anda, atau mendaftar untuk email promosi. Untuk Next-Best-Action resepnya, kumpulan data Tindakan diperlukan. Tidak ada resep kustom atau kasus penggunaan domain lain yang menggunakan data Tindakan. 
+ [**Interaksi**](action-interactions-datasets.md) aksi — Interaksi aksi adalah peristiwa interaksi antara pengguna dan tindakan. Next-Best-ActionResepnya menggunakan data ini dan data dalam kumpulan data Tindakan Anda untuk merekomendasikan tindakan kepada pengguna Anda. Tidak ada resep khusus atau kasus penggunaan domain lain yang menggunakan data Interaksi Tindakan. 

Amazon Personalize menyimpan data dalam *kumpulan data*, satu untuk setiap jenis data. Setiap dataset memiliki persyaratan yang berbeda. Saat mengimpor data ke kumpulan data Amazon Personalize, Anda dapat memilih untuk mengimpor rekaman secara massal, satu per satu, atau keduanya. Impor massal melibatkan pengimporan sejumlah besar catatan historis yang disimpan dalam satu atau beberapa file CSV di bucket Amazon S3.
+ Jika tidak memiliki data massal, Anda dapat menggunakan operasi impor individual untuk mengumpulkan data dan streaming peristiwa hingga memenuhi persyaratan pelatihan Amazon Personalize dan persyaratan data kasus atau resep penggunaan domain Anda. Untuk informasi tentang merekam acara, lihat[Merekam peristiwa waktu nyata untuk memengaruhi rekomendasi](recording-events.md). Untuk informasi tentang mengimpor catatan individual, lihat[Mengimpor catatan individual ke dalam kumpulan data Amazon Personalize](incremental-data-updates.md). 
+ Jika Anda tidak yakin memiliki cukup data atau jika Anda memiliki pertanyaan tentang kualitasnya, Anda dapat mengimpor data Anda ke kumpulan data Amazon Personalize dan menggunakan Amazon Personalize untuk menganalisisnya. Untuk informasi selengkapnya, lihat [Menganalisis kualitas dan kuantitas data di Amazon Personalisasi kumpulan data](analyzing-data.md).

 Bagian berikut menyediakan persyaratan data untuk setiap jenis kumpulan data Amazon Personalize dan pedoman untuk menyiapkan data massal. Jika Anda tidak memiliki data massal, tinjau bagian untuk memahami data yang diperlukan dan opsional yang dapat Anda impor dengan operasi impor individual. Jika Anda memerlukan bantuan tambahan untuk memformat data, Anda dapat menggunakan Amazon SageMaker AI Data Wrangler (Data Wrangler) untuk menyiapkan data Anda. Untuk informasi selengkapnya, lihat [Mempersiapkan dan mengimpor data massal menggunakan Amazon SageMaker AI Data Wrangler](preparing-importing-with-data-wrangler.md).

Setelah Anda selesai mempersiapkan data Anda, Anda siap untuk membuat file JSON skema. File ini memberi tahu Amazon Personalize tentang struktur data Anda. Untuk informasi selengkapnya, lihat [Membuat file JSON skema untuk skema Amazon Personalize](how-it-works-dataset-schema.md). 

**Topics**
+ [Pedoman format data massal untuk semua jenis data](#general-formatting-guidelines)
+ [Mempersiapkan data interaksi item untuk pelatihan](interactions-datasets.md)
+ [Mempersiapkan metadata item untuk pelatihan](items-datasets.md)
+ [Mempersiapkan metadata pengguna untuk pelatihan](users-datasets.md)
+ [Mempersiapkan metadata tindakan untuk pelatihan](actions-datasets.md)
+ [Mempersiapkan data interaksi tindakan untuk pelatihan](action-interactions-datasets.md)

## Pedoman format data massal untuk semua jenis data
<a name="general-formatting-guidelines"></a>

Panduan dan persyaratan berikut dapat membantu Anda memastikan data massal Anda diformat dengan benar.
+ Data masukan Anda harus dalam file CSV (nilai yang dipisahkan koma). 
+ Baris pertama file CSV Anda harus berisi header kolom Anda. Jangan lampirkan header dalam tanda kutip (“). 
+  Kolom harus memiliki nama alfanumerik yang unik. Misalnya, Anda tidak dapat menambahkan `GENRES_FIELD_1` bidang dan `GENRESFIELD1` bidang. 
+ Jika Anda mengimpor beberapa file CSV, semua header kolom harus cocok di semua file. 
+ Pastikan Anda memiliki bidang yang diperlukan untuk jenis kumpulan data Anda dan pastikan namanya selaras dengan persyaratan Amazon Personalize. Misalnya, data Item Anda mungkin memiliki kolom `ITEM_IDENTIFICATION_NUMBER` yang dipanggil IDs untuk setiap item Anda. Untuk menggunakan kolom ini sebagai bidang ITEM\$1ID, ganti nama kolom menjadi. `ITEM_ID` Jika Anda menggunakan Data Wrangler untuk memformat data, Anda dapat menggunakan **kolom Peta untuk transformasi Amazon Personalize** Data Wrangler untuk memastikan kolom Anda diberi nama dengan benar.

   Untuk informasi tentang menggunakan Data Wrangler untuk menyiapkan data Anda, lihat. [Mempersiapkan dan mengimpor data massal menggunakan Amazon SageMaker AI Data Wrangler](preparing-importing-with-data-wrangler.md)
+  Setiap catatan dalam file CSV Anda harus dalam satu baris. 
+ Amazon Personalize tidak mendukung tipe data yang kompleks seperti array dan peta.
+ Agar Amazon Personalisasi menggunakan data boolean saat melatih atau memfilter, gunakan nilai string `"True"` dan `"False"` atau nilai numerik `1` untuk true dan false. `0` 
+ Jika Anda menggunakan Data Wrangler untuk memformat data Anda, Anda dapat menggunakan Data Wrangler mengubah [Nilai Parse sebagai Jenis untuk mengonversi tipe](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) data.
+ `TIMESTAMP`dan `CREATION_TIMESTAMP` data harus dalam format waktu *epoch UNIX*. Untuk informasi selengkapnya, lihat [Data stempel waktu](interactions-datasets.md#timestamp-data).
+ Hindari menyertakan `"` karakter atau karakter khusus dalam ID item, ID pengguna, dan data ID tindakan.
+ Jika data Anda menyertakan karakter yang tidak dikodekan ASCII, file CSV Anda harus dikodekan dalam format UTF-8.
+ Pastikan Anda memformat data tekstual apa pun seperti yang dijelaskan dalam[Metadata teks tidak terstruktur](items-datasets.md#text-data).