Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Recette de similarité sémantique
La recette Semantic-Similarity (aws-semantic-similarity) génère des recommandations pour les éléments sémantiquement similaires à un élément donné en fonction du contenu textuel. Contrairement aux recettes de similarité traditionnelles qui reposent sur les interactions entre l'utilisateur et les éléments, cette recette analyse les descriptions textuelles et les attributs des éléments pour générer des intégrations et identifier les éléments sémantiquement similaires.
Cette recette est idéale pour les scénarios dans lesquels vous souhaitez recommander des articles en fonction de la similitude du contenu, par exemple en recommandant des livres ayant des thèmes similaires, des articles sur des sujets connexes ou des produits avec des descriptions similaires. Cela fonctionne particulièrement bien pour les nouveaux éléments dont l'historique des interactions est limité (scénarios de démarrage à froid) et pour les catalogues où les relations sémantiques sont plus importantes que les modèles de cooccurrence.
Avec Semantic-Similarity, vous fournissez un identifiant d'article lors d'une GetRecommendationsopération (ou dans la console Amazon Personalize) et Amazon Personalize renvoie une liste d'articles similaires. Vous pouvez également utiliser un flux de travail par lots pour obtenir des articles similaires pour tous les articles de votre inventaire (voir Obtenir des recommandations d'articles par lots).
Rubriques
Caractéristiques de la recette
Semantic-Similarity utilise les fonctionnalités de recette Amazon Personalize suivantes pour générer des recommandations d'articles :
-
Personnalisation en temps réel — Grâce à la recette Semantic-Similarity, Amazon Personalize met automatiquement à jour votre catalogue d'articles. Lorsque vous ajoutez de nouveaux éléments à votre jeu de données d'articles ou que vous mettez à jour les métadonnées d'éléments existantes, ces modifications sont reflétées dans vos recommandations dans un délai d'environ 30 minutes lorsque vous utilisez la formation incrémentielle. Cela garantit que vos clients voient toujours les articles les plus récents disponibles dans votre catalogue sans avoir à intervenir manuellement ou à attendre un cycle de recyclage complet. Cela est particulièrement utile pour les catalogues qui changent fréquemment, tels que les articles de presse, les articles de blog ou les offres de produits saisonnières. Pour activer les mises à jour incrémentielles, les clients doivent :
-
performIncrementalUpdateDéfini surtruepour la solution dans l'API -
Choisissez l'option « Entraînement complet et progressif » ou « Entraînement progressif » sous Méthode d'entraînement dans l'interface utilisateur
Notez que l'activation des mises à jour incrémentielles entraîne des coûts supplémentaires chaque fois qu'une mise à jour est effectuée.
-
-
Métadonnées avec recommandations : avec la recette de similarité sémantique, les campagnes ont automatiquement la possibilité d'inclure les métadonnées des articles dans les résultats des recommandations. Vous n'avez pas activé manuellement les métadonnées pour votre campagne. Vous pouvez utiliser les métadonnées pour enrichir les recommandations dans votre interface utilisateur, par exemple en ajoutant les genres de films aux carrousels. Pour plus d'informations, consultez la section Métadonnées des éléments dans les recommandations.
Ensembles de données obligatoires et facultatifs
Pour utiliser la recette Semantic-Similarity, vous devez créer un jeu de données Items. Amazon Personalize génère des recommandations basées sur la signification sémantique des métadonnées des articles. Pour plus d'informations, consultez la section Métadonnées de l'élément. Semantic-Similarity peut s'entraîner sur un maximum de 10 millions d'éléments dans votre jeu de données d'articles.
Avec Semantic-Similarity, Amazon Personalize a besoin de données sur les articles qui incluent les éléments suivants
-
Champ ItemName — Un champ de chaîne
itemNamedéfini sur.trueCe champ doit contenir le titre ou le nom de l'article. -
Champ de description textuelle — Au moins un champ de chaîne marqué comme
textualcontenant la description de l'élément. Il doit s'agir du champ qui décrit et représente le mieux l'article.
Amazon Personalize utilise ce champ pour générer des intégrations sémantiques qui capturent le sens et le contenu de vos articles.
En outre, le champ réservé CREATION_TIMESTAMP doit être défini si vous souhaitez utiliser un classement basé sur la fraîcheur. Pour de plus amples informations, veuillez consulter Propriétés et hyperparamètres.
Les ensembles de données suivants sont facultatifs et peuvent améliorer les recommandations :
-
Ensemble de données d'interactions : Amazon Personalize peut utiliser les données de votre jeu de données Interactions pour calculer les scores de popularité en fonction de l'engagement des utilisateurs à l'égard des articles. Vous pouvez utiliser les scores de popularité pour classer des articles similaires en fonction de leur popularité auprès des utilisateurs. Vous devez fournir un jeu de données Interactions si vous souhaitez utiliser le classement basé sur la popularité. Vous pouvez également utiliser les données d'un jeu de données Interactions pour filtrer les recommandations. Pour plus d'informations sur les données d'interaction que vous pouvez importer, consultez la section Données d'interaction entre les articles
Propriétés et hyperparamètres
La recette Semantic-Similarity possède les propriétés suivantes :
-
Nom –
aws-semantic-similarity -
Nom de la ressource Amazon (ARN) de la recette —
arn:aws:personalize:::recipe/aws-semantic-similarity -
Algorithme ARN —
arn:aws:personalize:::algorithm/aws-semantic-similarity -
ARN de transformation des fonctionnalités —
arn:aws:personalize:::feature-transformation/aws-semantic-similarity -
Type de recette —
RELATED_ITEMS
Pour de plus amples informations, veuillez consulter Choisir une recette.
La recette Semantic-Similarity ne présente aucun hyperparamètre, mais vous pouvez configurer des facteurs de popularité et de fraîcheur lorsque vous créez une campagne afin d'influencer le classement d'articles similaires.
Le tableau fournit les informations suivantes pour chaque facteur :
-
Plage: [lower bound, upper bound]
-
Type de valeur : integer (entier), Continuous (float) [continu (flottant)], Categorical (Boolean, list, string) [catégorique (booléen, liste, chaîne)]
| Nom | Description |
|---|---|
| Actualité |
Le facteur de fraîcheur représente la récente date d'un article. La fraîcheur est calculée en normalisant l'âge de l'article en fonction de son CREATION_TIMESTAMP. Pour utiliser le facteur de fraîcheur, vous devez inclure le champ CREATION_TIMESTAMP dans le schéma de votre jeu de données Items. Des valeurs plus élevées du facteur de fraîcheur donneront la priorité aux nouveaux articles parmi les recommandations sémantiquement similaires Valeur par défaut : Gamme : Type de valeur : Double |
| Popularité |
Le facteur de popularité représente la popularité d'un article en fonction des interactions des utilisateurs. La popularité est calculée en normalisant le nombre d'interactions reçues par chaque élément. Pour utiliser le facteur de popularité, vous devez inclure un jeu de données Interactions lors de la création de votre groupe de jeux de données. Les valeurs les plus élevées du facteur de popularité donnent la priorité aux articles faisant l'objet d'un plus grand nombre d'interactions avec les clients parmi des recommandations sémantiquement similaires. Valeur par défaut : Gamme : Type de valeur : Double |
Notez que les scores de fraîcheur et de popularité sont calculés lors de l'entraînement et que les mises à jour progressives ne mettent pas à jour les scores de popularité et de fraîcheur. Pour que les facteurs de popularité et de fraîcheur les plus récents influencent le classement des articles recommandés, utilisez le recyclage automatique ou redéfinissez manuellement la solution et mettez à jour la campagne avec la nouvelle version de la solution.