As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Receita de similaridade semântica
A receita de Semântica-Similaridade (aws-semantic-similarity) gera recomendações para itens que são semanticamente semelhantes a um determinado item com base no conteúdo textual. Diferentemente das receitas de similaridade tradicionais que dependem de interações entre usuários e itens, essa receita analisa as descrições textuais e os atributos dos itens para gerar incorporações e identificar itens semanticamente semelhantes.
Essa receita é ideal para cenários em que você deseja recomendar itens com base na semelhança de conteúdo, como recomendar livros com temas semelhantes, artigos sobre tópicos relacionados ou produtos com descrições semelhantes. Funciona particularmente bem para novos itens com histórico de interação limitado (cenários de inicialização a frio) e para catálogos em que as relações semânticas são mais importantes do que os padrões de coocorrência.
Com a Semântica-Similaridade, você fornece uma ID de item em uma GetRecommendationsoperação (ou no console Amazon Personalize) e o Amazon Personalize retorna uma lista de itens semelhantes. Ou você pode usar um fluxo de trabalho em lotes para obter itens semelhantes para todos os itens do seu inventário (consulte Como obter recomendações de itens em lote).
Recursos da fórmula
O Semantic-Silarity usa os seguintes recursos de receita do Amazon Personalize ao gerar recomendações de itens:
-
Personalização em tempo real — Com a receita de similaridade semântica, o Amazon Personalize mantém automaticamente seu catálogo de itens atualizado. Quando você adiciona novos itens ao seu conjunto de dados de Itens ou atualiza os metadados de itens existentes, essas alterações são refletidas em suas recomendações em aproximadamente 30 minutos ao usar o treinamento incremental. Isso garante que seus clientes sempre vejam os itens mais atuais disponíveis em seu catálogo sem precisar de intervenção manual ou esperar por um ciclo completo de reciclagem. Isso é particularmente valioso para catálogos que mudam com frequência, como artigos de notícias, postagens em blogs ou ofertas sazonais de produtos. Para habilitar atualizações incrementais, os clientes devem:
-
performIncrementalUpdateDefina comotruepara a solução na API -
Escolha a opção “Treinamento completo e incremental” ou “Treinamento incremental” em Método de treinamento na interface do usuário
Observe que habilitar atualizações incrementais acarretará custos adicionais sempre que uma atualização estiver sendo realizada.
-
-
Metadados com recomendações — Com a receita de similaridade semântica, as campanhas têm automaticamente a opção de incluir metadados do item nos resultados das recomendações. Você não precisa habilitar manualmente os metadados da sua campanha. É possível usar metadados para aprimorar as recomendações na interface de usuário, como adicionar gêneros de filmes a carrosséis. Para obter mais informações, consulte Metadados do item nas recomendações.
Conjuntos de dados obrigatórios e opcionais
Para usar a receita de Semântica-Similaridade, você deve criar um conjunto de dados de Itens. O Amazon Personalize gera recomendações com base no significado semântico dos metadados do item. Para obter mais informações, consulte Metadados do item. A similaridade semântica pode ser treinada em até 10 milhões de itens em seu conjunto de dados de itens.
Com a Semântica-Similaridade, o Amazon Personalize exige dados de itens que incluam o seguinte
-
campo itemName — Um campo de string definido como.
itemNametrueEsse campo deve conter o título ou o nome do item. -
Campo de descrição textual — Pelo menos um campo de string marcado como
textualesse contém a descrição do item. Esse deve ser o campo que melhor descreve e representa o item.
O Amazon Personalize usa esse campo para gerar incorporações semânticas que capturam o significado e o conteúdo dos seus itens.
Além disso, o campo reservado CREATION_TIMESTAMP deve ser definido se você quiser usar a classificação baseada em novidades. Para obter mais informações, consulte Propriedades e hiperparâmetros.
Os seguintes conjuntos de dados são opcionais e podem melhorar as recomendações:
-
Conjunto de dados de interações — O Amazon Personalize pode usar dados em seu conjunto de dados de interações para calcular pontuações de popularidade com base no engajamento do usuário com os itens. Você pode usar pontuações de popularidade para classificar itens semelhantes de acordo com a popularidade entre os usuários. Você deve fornecer um conjunto de dados de interações se quiser usar a classificação baseada em popularidade. Você também pode usar dados em um conjunto de dados de interações para filtrar recomendações. Para obter informações sobre os dados de interação que você pode importar, consulte Dados de interação do item
Propriedades e hiperparâmetros
A receita de similaridade semântica tem as seguintes propriedades:
-
Nome:
aws-semantic-similarity -
Fórmula nome do recurso da Amazon (ARN) –
arn:aws:personalize:::recipe/aws-semantic-similarity -
ARN do algoritmo –
arn:aws:personalize:::algorithm/aws-semantic-similarity -
ARN de transformação de atributos –
arn:aws:personalize:::feature-transformation/aws-semantic-similarity -
Tipo de fórmula –
RELATED_ITEMS
Para obter mais informações, consulte Escolher uma fórmula.
A receita de similaridade semântica não tem hiperparâmetros expostos, mas você pode configurar fatores de popularidade e atualização ao criar uma campanha para influenciar a classificação de itens semelhantes.
A tabela fornece as seguintes informações para cada fator:
-
Intervalo: [limite inferior, limite superior]
-
Tipo de valor: inteiro, contínuo (float), categórico (booliano, lista, string)
| Name (Nome) | Description |
|---|---|
| Freshness |
O fator de frescura representa o quão recente é um item. O frescor é calculado normalizando a idade do item com base em seu CREATION_TIMESTAMP. Para usar o fator de atualização, você deve incluir o campo CREATION_TIMESTAMP no esquema do conjunto de dados Itens. Valores mais altos do fator de frescura priorizarão itens mais novos entre recomendações semanticamente semelhantes Valor padrão: Alcance: Tipo de valor: Duplo |
| Popularidade |
O fator popularidade representa a popularidade de um item com base nas interações do usuário. A popularidade é calculada pela normalização do número de interações que cada item recebeu. Para usar o fator de popularidade, você deve incluir um conjunto de dados Interações ao criar seu grupo de conjuntos de dados. Valores mais altos do fator de popularidade priorizam itens com mais interações com o cliente entre recomendações semanticamente semelhantes. Valor padrão: Alcance: Tipo de valor: Duplo |
Observe que as pontuações de atualização e popularidade são calculadas no treinamento e as atualizações incrementais não atualizarão as pontuações de popularidade e atualização. Para que os fatores mais recentes de popularidade e atualização influenciem a classificação dos itens recomendados, use a reciclagem automática ou treine manualmente a solução e atualize a campanha com a nova versão da solução.