

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Mempersiapkan metadata pengguna untuk pelatihan
<a name="users-datasets"></a>

 Data pengguna yang dapat Anda impor ke Amazon Personalize mencakup data numerik, seperti usia pengguna, dan metadata kategoris, seperti jenis kelamin atau keanggotaan loyalitas. Anda mengimpor metadata tentang pengguna Anda ke dalam kumpulan data Amazon *Personalize* Users. 

Bergantung pada kasus penggunaan domain atau resep khusus Anda, metadata pengguna dapat membantu Amazon Personalize merekomendasikan item yang lebih relevan kepada pengguna atau merekomendasikan segmen pengguna yang lebih bermakna. Dan setelah pelatihan, ini dapat membantu model Anda merekomendasikan item untuk pengguna tanpa data interaksi apa pun. Untuk informasi selengkapnya tentang kasus penggunaan atau resep yang menggunakan metadata pengguna, lihat persyaratan data untuk kasus atau resep penggunaan domain Anda. [Mencocokkan kasus penggunaan Anda dengan Amazon Personalize resource](use-cases-and-recipes.md)

 Saat pelatihan, Amazon Personalize tidak menggunakan data pengguna string non-kategoris, seperti nama pengguna, kata kunci tentang pengguna, atau tag. Namun, mengimpor data ini masih dapat meningkatkan rekomendasi. Untuk informasi selengkapnya, lihat [Data string non-kategoris](#user-string-data). 

Untuk semua kasus penggunaan domain dan resep khusus, data pengguna massal Anda harus dalam file CSV. Setiap baris dalam file harus mewakili pengguna yang unik. Setelah Anda selesai mempersiapkan data Anda, Anda siap untuk membuat file JSON skema. File ini memberi tahu Amazon Personalize tentang struktur data Anda. Untuk informasi selengkapnya, lihat [Membuat file JSON skema untuk skema Amazon Personalize](how-it-works-dataset-schema.md).

Bagian berikut memberikan informasi selengkapnya tentang cara menyiapkan data pengguna Anda untuk Amazon Personalize. Untuk pedoman format data massal untuk semua jenis data, lihat [pedoman format data massal](preparing-training-data.md#general-formatting-guidelines)

**Topics**
+ [Persyaratan data pengguna](#user-data-requirements)
+ [Metadata kategoris](#user-categorical-data)
+ [Data string non-kategoris](#user-string-data)
+ [Contoh metadata pengguna](#users-data-example)

## Persyaratan data pengguna
<a name="user-data-requirements"></a>

 Berikut ini adalah persyaratan data pengguna untuk Amazon Personalize. Anda bebas menambahkan kolom kustom tambahan tergantung pada kasus penggunaan dan data Anda.
+ Data Anda harus memiliki kolom USER\_ID yang menyimpan pengenal unik untuk setiap pengguna. Setiap pengguna harus memiliki ID pengguna. Itu harus `string` dengan panjang maksimal 256 karakter.
+ Data Anda harus memiliki setidaknya satu string kategoris atau kolom metadata numerik. Kolom metadata pengguna dapat menyertakan empty/null nilai untuk beberapa pengguna. Kami menyarankan agar kolom-kolom ini minimal 70 persen selesai.
+ Jumlah maksimum kolom metadata adalah 25.

Jika Anda tidak yakin memiliki cukup data atau jika Anda memiliki pertanyaan tentang kualitasnya, Anda dapat mengimpor data Anda ke kumpulan data Amazon Personalize dan menggunakan Amazon Personalize untuk menganalisisnya. Untuk informasi selengkapnya, lihat [Menganalisis kualitas dan kuantitas data di Amazon Personalisasi kumpulan data](analyzing-data.md).

## Metadata kategoris
<a name="user-categorical-data"></a>

Dengan beberapa resep dan semua kasus penggunaan domain, Amazon Personalize menggunakan metadata kategoris, seperti jenis kelamin, minat, atau status keanggotaan pengguna, saat mengidentifikasi pola dasar yang mengungkapkan item paling relevan bagi pengguna Anda. Anda menentukan rentang nilai Anda sendiri berdasarkan kasus penggunaan Anda. Metadata kategoris bisa dalam bahasa apa pun. 

Untuk pengguna dengan beberapa kategori, pisahkan setiap nilai dengan bilah vertikal, '\|'. Misalnya, untuk bidang KEPENTINGAN, data Anda untuk pengguna mungkin`Movies|TV Shows|Music`.

Dengan semua resep dan domain, Anda dapat mengimpor metadata kategoris dan menggunakannya untuk memfilter rekomendasi berdasarkan atribut pengguna. Untuk informasi tentang rekomendasi pemfilteran lihat[Memfilter rekomendasi dan segmen pengguna](filter.md). 

Nilai kategoris dapat memiliki paling banyak 1000 karakter. Jika Anda memiliki pengguna dengan nilai kategoris dengan lebih dari 1000 karakter, pekerjaan impor dataset Anda akan gagal.

## Data string non-kategoris
<a name="user-string-data"></a>

 Kecuali untuk pengguna IDs, Amazon Personalize tidak menggunakan data string non-kategoris saat pelatihan, seperti nama pengguna, kata kunci tentang pengguna, atau tag. Namun, Amazon Personalize dapat menggunakannya saat memfilter rekomendasi. Anda dapat membuat filter untuk menyertakan atau menghapus item dari rekomendasi berdasarkan data string non-kategoris tentang pengguna yang Anda dapatkan rekomendasi untuk (the). CurrentUser Untuk informasi lebih lanjut tentang filter, lihat [Memfilter rekomendasi dan segmen pengguna](filter.md). Nilai non-kategoris dapat memiliki maksimum 1000 karakter. 

## Contoh metadata pengguna
<a name="users-data-example"></a>

Beberapa baris pertama metadata pengguna dalam file CSV mungkin terlihat seperti berikut ini.

```
USER_ID,AGE,GENDER,INTEREST
5,34,Male,hiking
6,56,Female,music
8,65,Male,movies|TV shows|music
...
...
```

`USER_ID`Kolom diperlukan dan menyimpan pengidentifikasi unik untuk setiap pengguna individu. `AGE`Kolom adalah metadata numerik. `INTEREST`Kolom `GENDER` dan menyimpan metadata kategoris untuk setiap pengguna. 

Setelah Anda selesai mempersiapkan data Anda, Anda siap untuk membuat file JSON skema. File ini memberi tahu Amazon Personalize tentang struktur data Anda. Untuk informasi selengkapnya, lihat [Membuat file JSON skema untuk skema Amazon Personalize](how-it-works-dataset-schema.md). Seperti inilah tampilan file JSON skema untuk data sampel di atas.

```
{
  "type": "record",
  "name": "Users",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
      {
          "name": "USER_ID",
          "type": "string"
      },
      {
          "name": "AGE",
          "type": "int"
      },
      {
          "name": "GENDER",
          "type": "string",
          "categorical": true
      },
      {
          "name": "INTEREST",
          "type": "string",
          "categorical": true
      }
  ],
  "version": "1.0"
}
```