Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Receta de similitud semántica
La receta de similitud semántica (aws-semantic-similarity) genera recomendaciones para elementos que son semánticamente similares a un elemento determinado en función del contenido textual. A diferencia de las recetas de similitud tradicionales que se basan en las interacciones entre el usuario y el elemento, esta receta analiza las descripciones textuales y los atributos de los elementos para generar incrustaciones e identificar elementos semánticamente similares
Esta receta es ideal para situaciones en las que quieres recomendar elementos en función de la similitud del contenido, como por ejemplo, recomendar libros con temas similares, artículos sobre temas relacionados o productos con descripciones similares. Funciona especialmente bien para artículos nuevos con un historial de interacciones limitado (escenarios de inicio en frío) y para catálogos en los que las relaciones semánticas son más importantes que los patrones de coocurrencia.
Con Semantic-Silarity, usted proporciona un identificador de artículo en una GetRecommendationsoperación (o en la consola Amazon Personalize) y Amazon Personalize devuelve una lista de artículos similares. O bien, puedes usar un flujo de trabajo por lotes para obtener artículos similares para todos los artículos de tu inventario (consulta Cómo obtener recomendaciones de artículos por lotes).
Temas
Características de la receta
Semantic-Silarity utiliza las siguientes funciones de recetas de Amazon Personalize al generar recomendaciones de artículos:
-
Personalización en tiempo real: con la receta de similitud semántica, Amazon Personalize mantiene tu catálogo de artículos actualizado automáticamente. Cuando agrega nuevos artículos a su conjunto de datos de artículos o actualiza los metadatos de los artículos existentes, estos cambios se reflejan en sus recomendaciones en aproximadamente 30 minutos si utiliza el entrenamiento gradual. Esto garantiza que tus clientes siempre vean los artículos más recientes disponibles en tu catálogo sin necesidad de intervención manual ni de esperar a que se complete un ciclo de reentrenamiento. Esto resulta especialmente útil para los catálogos que cambian con frecuencia, como artículos de noticias, publicaciones de blogs o ofertas de productos de temporada. Para habilitar las actualizaciones incrementales, los clientes deben:
-
performIncrementalUpdatetrueConfigúrelo como para la solución en la API -
Elija la opción «Entrenamiento completo e incremental» o «Entrenamiento incremental» en Método de entrenamiento en la interfaz de usuario
Tenga en cuenta que habilitar las actualizaciones incrementales generará costos adicionales cada vez que se realice una actualización.
-
-
Metadatos con recomendaciones: con la fórmula de similitud semántica, las campañas tienen automáticamente la opción de incluir los metadatos de los artículos en los resultados de las recomendaciones. No tiene que activar manualmente los metadatos de la campaña. Puede usar metadatos para enriquecer las recomendaciones de la interfaz de usuario, por ejemplo, agregar los géneros de las películas a los carruseles. Para obtener más información, consulta los metadatos de los elementos en las recomendaciones.
Conjuntos de datos obligatorios y opcionales
Para usar la receta de similitud semántica, debes crear un conjunto de datos de elementos. Amazon Personalize genera recomendaciones basadas en el significado semántico de los metadatos de los artículos. Para obtener más información, consulte Metadatos del artículo. La similitud semántica puede procesar hasta 10 millones de elementos de tu conjunto de datos de elementos.
Con Semantic-Silarity, Amazon Personalize requiere datos de artículos que incluyan lo siguiente
-
Campo ItemName: un campo de cadena
itemNameestablecido en.trueEste campo debe contener el título o el nombre del elemento. -
Campo de descripción textual: al menos un campo de cadena marcado como
textualque contiene la descripción del elemento. Debe ser el campo que mejor describa y represente el elemento.
Amazon Personalize usa este campo para generar incrustaciones semánticas que capturen el significado y el contenido de sus artículos.
Además, debe configurar el campo reservado CREATION_TIMESTAMP si desea utilizar una clasificación basada en la frescura. Para obtener más información, consulte Propiedades e hiperparámetros.
Los siguientes conjuntos de datos son opcionales y pueden mejorar las recomendaciones:
-
Conjunto de datos de interacciones: Amazon Personalize puede usar los datos de su conjunto de datos de interacciones para calcular las puntuaciones de popularidad en función de la interacción de los usuarios con los artículos. Puede utilizar las puntuaciones de popularidad para clasificar artículos similares en función de su popularidad entre los usuarios. Debes proporcionar un conjunto de datos de interacciones si quieres utilizar una clasificación basada en la popularidad. También puedes usar los datos de un conjunto de datos de interacciones para filtrar las recomendaciones. Para obtener información sobre los datos de interacción que puede importar, consulte Datos de interacción entre elementos
Propiedades e hiperparámetros
La receta de similitud semántica tiene las siguientes propiedades:
-
Nombre:
aws-semantic-similarity -
Nombre de recurso de Amazon (ARN) de la receta:
arn:aws:personalize:::recipe/aws-semantic-similarity -
ARN del algoritmo:
arn:aws:personalize:::algorithm/aws-semantic-similarity -
ARN de transformación de características:
arn:aws:personalize:::feature-transformation/aws-semantic-similarity -
Tipo de receta:
RELATED_ITEMS
Para obtener más información, consulte Elección de una receta.
La receta de similitud semántica no tiene hiperparámetros expuestos, pero puedes configurar los factores de popularidad y frescura al crear una campaña para influir en la clasificación de artículos similares.
La tabla proporciona la siguiente información para cada factor:
-
Rango: [límite inferior, límite superior]
-
Tipo de valor: número entero, continuo (flotante), categórico (booleano, lista, cadena)
| Name | Description (Descripción) |
|---|---|
| Antigüedad |
El factor de frescura representa qué tan reciente es un artículo. La frescura se calcula normalizando la antigüedad del artículo en función de su CREATION_TIMESTAMP. Para usar el factor de frescura, debes incluir el campo CREATION_TIMESTAMP en el esquema del conjunto de datos de Items. Los valores más altos del factor de frescura darán prioridad a los elementos más nuevos entre las recomendaciones semánticamente similares Valor predeterminado: Rango: Tipo de valor: doble |
| Popularidad |
El factor de popularidad representa la popularidad de un artículo en función de las interacciones de los usuarios. La popularidad se calcula normalizando el número de interacciones que recibe cada artículo. Para usar el factor de popularidad, debes incluir un conjunto de datos de interacciones al crear tu grupo de conjuntos de datos. Los valores más altos del factor de popularidad dan prioridad a los artículos con más interacciones con los clientes entre recomendaciones semánticamente similares. Valor predeterminado: Rango: Tipo de valor: doble |
Ten en cuenta que las puntuaciones de frescura y popularidad se calculan durante el entrenamiento y que las actualizaciones incrementales no actualizan las puntuaciones de popularidad y frescura. Para que los factores de popularidad y frescura más recientes influyan en la clasificación de los artículos recomendados, utilice el reentrenamiento automático o el reentrenamiento manual de la solución y actualice la campaña con la nueva versión de la solución.