Resep Semantik-Kesamaan - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Resep Semantik-Kesamaan

Resep Semantic-Similarity (aws-semantic-similarity) menghasilkan rekomendasi untuk item yang secara semantik mirip dengan item tertentu berdasarkan konten tekstual. Tidak seperti resep kesamaan tradisional yang mengandalkan interaksi item pengguna, resep ini menganalisis deskripsi tekstual dan atribut item untuk menghasilkan embeddings dan mengidentifikasi item yang serupa secara semantik

Resep ini sangat ideal untuk skenario di mana Anda ingin merekomendasikan item berdasarkan kesamaan konten, seperti merekomendasikan buku dengan tema serupa, artikel tentang topik terkait, atau produk dengan deskripsi serupa. Ini bekerja sangat baik untuk item baru dengan riwayat interaksi terbatas (skenario awal dingin) dan untuk katalog di mana hubungan semantik lebih penting daripada pola kejadian bersama.

Dengan Semantic-Similarity, Anda memberikan ID item dalam GetRecommendationsoperasi (atau konsol Amazon Personalize) dan Amazon Personalize mengembalikan daftar item serupa. Atau Anda dapat menggunakan alur kerja batch untuk mendapatkan item serupa untuk semua item dalam inventaris Anda (lihat Mendapatkan rekomendasi item batch).

Fitur resep

Semantic-Similarity menggunakan fitur resep Amazon Personalize berikut saat membuat rekomendasi item:

  • Personalisasi waktu nyata - Dengan resep Semantic-Similarity, Amazon Personalize secara otomatis membuat katalog item Anda tetap up to date. Saat Anda menambahkan item baru ke kumpulan data Item atau memperbarui metadata item yang ada, perubahan ini tercermin dalam rekomendasi Anda dalam waktu sekitar 30 menit saat menggunakan pelatihan tambahan. Ini memastikan bahwa pelanggan Anda selalu melihat item terbaru yang tersedia di katalog Anda tanpa memerlukan intervensi manual atau menunggu siklus pelatihan ulang penuh. Ini sangat berharga untuk katalog yang sering berubah, seperti artikel berita, posting blog, atau penawaran produk musiman. Untuk mengaktifkan pembaruan tambahan, pelanggan harus:

    • Setel performIncrementalUpdate ke true solusi di API

    • Pilih opsi “Pelatihan Penuh dan Inkremental” atau “Pelatihan tambahan” di bawah Metode Pelatihan di UI

    Perhatikan bahwa mengaktifkan pembaruan tambahan akan dikenakan biaya tambahan setiap kali pembaruan dilakukan.

  • Metadata dengan rekomendasi — Dengan resep Semantic-Similarity, kampanye secara otomatis memiliki opsi untuk menyertakan metadata item dengan hasil rekomendasi. Anda tidak mengaktifkan metadata secara manual untuk kampanye Anda. Anda dapat menggunakan metadata untuk memperkaya rekomendasi di antarmuka pengguna, seperti menambahkan genre film ke komidi putar. Untuk informasi selengkapnya, lihat Metadata item dalam rekomendasi.

Kumpulan data yang diperlukan dan opsional

Untuk menggunakan resep Semantic-Similarity, Anda harus membuat dataset Item. Amazon Personalize menghasilkan rekomendasi berdasarkan arti semantik metadata item. Untuk informasi selengkapnya, lihat Metadata item. Semantic-Similarity dapat melatih hingga 10 juta item dalam kumpulan data Item Anda.

Dengan Semantic-Similarity, Amazon Personalize memerlukan data Item yang mencakup hal-hal berikut

  • ItemName field - Satu bidang itemName string dengan set ke. true Bidang ini harus berisi judul atau nama item.

  • Bidang deskripsi tekstual - Setidaknya satu bidang string ditandai sebagai textual yang berisi deskripsi item. Ini harus menjadi bidang yang paling menggambarkan dan mewakili item.

Amazon Personalize menggunakan bidang ini untuk menghasilkan embeddings semantik yang menangkap makna dan konten item Anda.

Selain itu, bidang CREATION_TIMESTAMP yang dicadangkan harus disetel jika Anda ingin menggunakan peringkat berbasis kesegaran. Untuk informasi selengkapnya, lihat Properti dan hiperparameter.

Kumpulan data berikut bersifat opsional dan dapat meningkatkan rekomendasi:

  • Kumpulan data interaksi- Amazon Personalize dapat menggunakan data dalam kumpulan data Interaksi Anda untuk menghitung skor popularitas berdasarkan keterlibatan pengguna dengan item. Anda dapat menggunakan skor popularitas untuk memberi peringkat item serupa berdasarkan seberapa populer mereka di kalangan pengguna. Anda harus menyediakan kumpulan data Interaksi jika Anda ingin menggunakan peringkat berbasis popularitas. Anda juga dapat menggunakan data dalam kumpulan data Interaksi untuk memfilter rekomendasi. Untuk informasi tentang data interaksi yang dapat Anda impor, lihat Data interaksi item

Properti dan hiperparameter

Resep Semantic-Similarity memiliki sifat-sifat berikut:

  • Namaaws-semantic-similarity

  • Resep Nama Sumber Daya Amazon (ARN) — arn:aws:personalize:::recipe/aws-semantic-similarity

  • Algoritma ARNarn:aws:personalize:::algorithm/aws-semantic-similarity

  • Transformasi fitur ARNarn:aws:personalize:::feature-transformation/aws-semantic-similarity

  • Jenis resepRELATED_ITEMS

Untuk informasi selengkapnya, lihat Memilih resep.

Resep Semantic-Similarity tidak memiliki hiperparameter yang terbuka tetapi Anda dapat mengonfigurasi faktor popularitas dan kesegaran saat membuat kampanye untuk memengaruhi peringkat item serupa.

Tabel memberikan informasi berikut untuk setiap faktor:

  • Rentang: [batas bawah, batas atas]

  • Jenis nilai: Integer, Continuous (float), Kategoris (Boolean, daftar, string)

Nama Deskripsi
Kesegaran

Faktor kesegaran mewakili seberapa baru suatu item. Kesegaran dihitung dengan menormalkan usia item berdasarkan CREATION_TIMESTAMP-nya. Untuk menggunakan faktor kesegaran, Anda harus menyertakan bidang CREATION_TIMESTAMP dalam skema kumpulan data Item Anda. Nilai faktor kesegaran yang lebih tinggi akan memprioritaskan item yang lebih baru di antara rekomendasi yang serupa secara semantik

Nilai default: 0.0

Rentang: [0.0, 1.0]

Jenis nilai: Ganda

Popularitas

Faktor popularitas mewakili seberapa populer suatu item didasarkan pada interaksi pengguna. Popularitas dihitung dengan menormalkan jumlah interaksi setiap item yang diterima. Untuk menggunakan faktor popularitas, Anda harus menyertakan kumpulan data Interaksi saat membuat grup kumpulan data Anda. Nilai faktor popularitas yang lebih tinggi memprioritaskan item dengan lebih banyak interaksi pelanggan di antara rekomendasi yang serupa secara semantik.

Nilai default: 0.0

Rentang: [0.0, 1.0]

Jenis nilai: Ganda

Perhatikan bahwa skor kesegaran dan popularitas dihitung pada pelatihan dan pembaruan tambahan tidak akan memperbarui skor popularitas dan kesegaran. Untuk faktor popularitas dan kesegaran terbaru yang memengaruhi peringkat item yang direkomendasikan, gunakan pelatihan ulang otomatis atau latih ulang solusi secara manual dan perbarui kampanye dengan versi solusi baru.