セマンティック類似レシピ - Amazon Personalize

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

セマンティック類似レシピ

Semantic-Similarity レシピ (aws-semantic-similarity) は、テキストコンテンツに基づいて、特定のアイテムと意味的に類似したアイテムのレコメンデーションを生成します。ユーザーとアイテムのインタラクションに依存する従来の類似度レシピとは異なり、このレシピはアイテムのテキストの説明と属性を分析して埋め込みを生成し、意味的に類似したアイテムを識別します。

このレシピは、類似するテーマの本、関連トピックの記事、または類似する説明の製品のレコメンデーションなど、コンテンツの類似性に基づいてアイテムをレコメンデーションするシナリオに最適です。インタラクション履歴が限られている新しいアイテム (コールドスタートシナリオ) や、セマンティック関係が同時実行パターンよりも重要であるカタログに適しています。

Semantic-Similarity では、GetRecommendations オペレーション (または Amazon Personalize コンソール) で項目 ID を指定すると、Amazon Personalize は類似項目のリストを返します。または、バッチワークフローを使用して、インベントリ内のすべての項目の類似項目を取得することもできます (「バッチ項目のレコメンデーションの取得」を参照)。

レシピ機能

Semantic-Similarity は、アイテムレコメンデーションを生成するときに次の Amazon Personalize レシピ機能を使用します。

  • リアルタイムのパーソナライゼーション – Semantic-Similarity レシピを使用すると、Amazon Personalize はアイテムカタログを自動的に最新の状態に保ちます。Items データセットに新しい項目を追加したり、既存の項目メタデータを更新したりすると、これらの変更は増分トレーニングを使用するときに約 30 分以内にレコメンデーションに反映されます。これにより、顧客は手動での介入や完全な再トレーニングサイクルを待つことなく、カタログで利用可能な最新のアイテムを常に確認できます。これは、ニュース記事、ブログ記事、季節性商品など、頻繁に変化するカタログに特に役立ちます。増分更新を有効にするには、お客様は以下を行う必要があります。

    • API performIncrementalUpdate のソリューションtrueの を に設定します。

    • UI の Training メソッドで「Full and Incremental training」または「Incremental training」オプションを選択します。

    増分更新を有効にすると、更新が実行されるたびに追加コストが発生することに注意してください。

  • レコメンデーションを含むメタデータ – Semantic-Similarity レシピを使用すると、キャンペーンにはレコメンデーション結果にアイテムメタデータを含めるオプションが自動的にあります。キャンペーンのメタデータを手動で有効にすることはできません。メタデータを使用して、映画のジャンルをカルーセルに追加するなど、ユーザーインターフェイスのレコメンデーションを充実させることができます。詳細については、「レコメンデーションのアイテムメタデータ」を参照してください。

必須およびオプションのデータセット

Semantic-Similarity レシピを使用するには、Items データセットを作成する必要があります。Amazon Personalize は、アイテムメタデータの意味論的意味に基づいてレコメンデーションを生成します。詳細については、「アイテムメタデータ」を参照してください。セマンティック類似度は、Items データセット内の最大 1,000 万個の項目でトレーニングできます。

セマンティック類似度では、Amazon Personalize には以下を含むアイテムデータが必要です。

  • itemName フィールド – を itemNameに設定して 1 つの文字列フィールドtrue。このフィールドには、項目のタイトルまたは名前を含める必要があります。

  • テキスト説明フィールド – 項目の説明を含む としてマークtextualされた文字列フィールドが少なくとも 1 つあります。これは、項目を最もよく説明および表すフィールドである必要があります。

Amazon Personalize は、このフィールドを使用して、アイテムの意味と内容をキャプチャするセマンティック埋め込みを生成します。

さらに、鮮度ベースのランキングを使用する場合は、予約済み CREATION_TIMESTAMP フィールドを設定する必要があります。詳細については、「プロパティおよびハイパーパラメータ」を参照してください。

次のデータセットはオプションであり、レコメンデーションを改善できます。

  • インタラクションデータセット – Amazon Personalize は、インタラクションデータセット内のデータを使用して、アイテムに対するユーザーエンゲージメントに基づいて人気スコアを計算できます。人気スコアを使用して、類似アイテムがユーザー間でどの程度人気があるかをランク付けできます。人気ベースのランキングを使用する場合は、Interactions データセットを指定する必要があります。Interactions データセットのデータを使用してレコメンデーションをフィルタリングすることもできます。インポートできるインタラクションデータの詳細については、「アイテムインタラクションデータ」を参照してください。

プロパティおよびハイパーパラメータ

Semantic-Similarity レシピには、次のプロパティがあります。

  • 名前aws-semantic-similarity

  • レシピ Amazon リソースネーム (ARN)arn:aws:personalize:::recipe/aws-semantic-similarity

  • アルゴリズム ARNarn:aws:personalize:::algorithm/aws-semantic-similarity

  • 機能変換 ARNarn:aws:personalize:::feature-transformation/aws-semantic-similarity

  • レシピタイプRELATED_ITEMS

詳細については、「レシピの選択」を参照してください。

Semantic-Similarity レシピには公開されたハイパーパラメータはありませんが、類似アイテムのランキングに影響を与えるキャンペーンを作成するときに、人気と鮮度の要素を設定できます。

この表は、要素ごとに次の情報を提供します。

  • 範囲: [下限、上限]

  • 値のタイプ: 整数、連続 (浮動小数点)、カテゴリ別 (ブール値、リスト、文字列)

名前 説明
Freshness

鮮度係数は、アイテムの最新の状態を表します。鮮度は、CREATION_TIMESTAMP に基づいて項目の経過時間を正規化することで計算されます。鮮度係数を使用するには、アイテムデータセットスキーマに CREATION_TIMESTAMP フィールドを含める必要があります。鮮度係数の値が大きいほど、意味的に類似したレコメンデーションの中で新しいアイテムが優先されます。

デフォルト値: 0.0

範囲: [0.0, 1.0]

値タイプ: Double

人気

人気要因は、ユーザーのインタラクションに基づくアイテムの人気度を表します。人気は、各項目が受信したインタラクションの数を正規化することによって計算されます。人気要素を使用するには、データセットグループを作成するときに Interactions データセットを含める必要があります。人気要因の値が高いほど、意味的に類似したレコメンデーション間で顧客とのやりとりが多いアイテムが優先されます。

デフォルト値: 0.0

範囲: [0.0, 1.0]

値タイプ: Double

鮮度スコアと人気スコアはトレーニング時に計算され、増分更新では人気スコアと鮮度スコアは更新されないことに注意してください。推奨されるアイテムのランキングに影響を与える最新の人気要因と鮮度要因については、自動再トレーニングを使用するか、ソリューションを手動で再トレーニングして、新しいソリューションバージョンでキャンペーンを更新します。