의미 체계-유사성 레시피 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

의미 체계-유사성 레시피

의미 체계 유사 레시피(aws-semantic-similarity)는 텍스트 콘텐츠를 기반으로 특정 항목과 의미상 유사한 항목에 대한 권장 사항을 생성합니다. 사용자-항목 상호 작용에 의존하는 기존 유사성 레시피와 달리이 레시피는 항목의 텍스트 설명과 속성을 분석하여 임베딩을 생성하고 의미상 유사한 항목을 식별합니다.

이 레시피는 테마가 유사한 책 추천, 관련 주제에 대한 기사 또는 설명이 유사한 제품 등 콘텐츠 유사성을 기반으로 항목을 추천하려는 시나리오에 적합합니다. 상호 작용 기록이 제한된 새 항목(콜드 스타트 시나리오)과 시맨틱 관계가 동시 발생 패턴보다 더 중요한 카탈로그에 특히 적합합니다.

의미 체계-유사성을 사용하면 GetRecommendations 작업(또는 Amazon Personalize 콘솔)에 항목 ID를 제공하고 Personalize는 유사한 항목 목록을 반환합니다. 또는 배치 워크플로를 사용하여 인벤토리의 모든 항목에 대해 유사한 항목을 가져올 수 있습니다(배치 항목 권장 사항 가져오기 참조).

레시피 기능

의미 체계-유사성은 항목 추천을 생성할 때 다음과 같은 Personalize 레시피 기능을 사용합니다.

  • 실시간 개인 맞춤 - Amazon Personalize는 의미 체계 유사 레시피를 사용하여 항목 카탈로그를 자동으로 최신 상태로 유지합니다. 항목 데이터 세트에 새 항목을 추가하거나 기존 항목 메타데이터를 업데이트하면 증분 훈련을 사용할 때 약 30분 이내에 이러한 변경 사항이 권장 사항에 반영됩니다. 이렇게 하면 고객이 수동 개입이나 전체 재훈련 주기를 기다리지 않고도 카탈로그에서 사용할 수 있는 최신 항목을 항상 볼 수 있습니다. 이는 뉴스 기사, 블로그 게시물 또는 계절 제품 상품과 같이 자주 변경되는 카탈로그에 특히 유용합니다. 증분 업데이트를 활성화하려면 고객이 다음을 수행해야 합니다.

    • API의 솔루션에 performIncrementalUpdate true 대해 로 설정

    • UI의 훈련 방법에서 "전체 및 증분 훈련" 또는 "증분 훈련" 옵션을 선택합니다.

    증분 업데이트를 활성화하면 업데이트가 수행될 때마다 추가 비용이 발생합니다.

  • 권장 사항이 포함된 메타데이터 - 의미 체계 유사 레시피를 사용하면 캠페인은 추천 결과와 함께 항목 메타데이터를 자동으로 포함할 수 있습니다. 캠페인에 대한 메타데이터를 수동으로 활성화하지 않았습니다. 메타데이터를 통해 사용자 인터페이스에서 추천을 강화할 수 있습니다(예: 캐러셀에 영화 장르 추가). 자세한 내용은 권장 사항의 항목 메타데이터를 참조하세요.

필수 및 선택형 데이터 세트

의미 체계-유사성 레시피를 사용하려면 항목 데이터 세트를 생성해야 합니다. Personalize는 항목 메타데이터의 의미에 따라 추천을 생성합니다. 자세한 내용은 항목 메타데이터를 참조하세요. 의미 체계-유사성은 항목 데이터 세트에서 최대 1천만 개의 항목을 훈련할 수 있습니다.

의미 체계-유사성을 통해 Personalize에는 다음이 포함된 항목 데이터가 필요합니다.

  • itemName 필드 -가 로 itemName 설정된 문자열 필드 1개true. 이 필드에는 항목의 제목 또는 이름이 포함되어야 합니다.

  • 텍스트 설명 필드 - 항목에 대한 설명이 포함된 textual 로 표시된 하나 이상의 문자열 필드입니다. 항목을 가장 잘 설명하고 나타내는 필드여야 합니다.

Personalize는이 필드를 사용하여 항목의 의미와 콘텐츠를 캡처하는 의미 체계 임베딩을 생성합니다.

또한 신선도 기반 순위를 사용하려면 예약된 CREATION_TIMESTAMP 필드를 설정해야 합니다. 자세한 내용은 속성 및 하이퍼파라미터 단원을 참조하십시오.

다음 데이터세트는 선택 사항이며 추천 사항을 개선할 수 있습니다.

  • 상호작용 데이터 세트 - Personalize는 상호작용 데이터 세트의 데이터를 사용하여 항목에 대한 사용자 참여를 기반으로 인기 점수를 계산할 수 있습니다. 인기도 점수를 사용하여 사용자의 인기도에 따라 유사한 항목의 순위를 매길 수 있습니다. 인기도 기반 순위를 사용하려면 상호작용 데이터세트를 제공해야 합니다. 상호작용 데이터 세트의 데이터를 사용하여 추천을 필터링할 수도 있습니다. 가져올 수 있는 상호 작용 데이터에 대한 자세한 내용은 항목 상호 작용 데이터를 참조하세요.

속성 및 하이퍼파라미터

의미 체계 유사 레시피의 속성은 다음과 같습니다.

  • 명칭aws-semantic-similarity

  • 레시피 리소스 이름(ARN) - arn:aws:personalize:::recipe/aws-semantic-similarity

  • 알고리즘 ARN - arn:aws:personalize:::algorithm/aws-semantic-similarity

  • 특성 변환 ARN - arn:aws:personalize:::feature-transformation/aws-semantic-similarity

  • 레시피 유형 - RELATED_ITEMS

자세한 내용은 레시피 선택 단원을 참조하십시오.

의미 체계 유사 레시피에는 노출된 하이퍼파라미터가 없지만 캠페인을 생성할 때 인기도 및 신선도 요소를 구성하여 유사한 항목의 순위에 영향을 줄 수 있습니다.

이 표에는 각 요인에 대한 다음 정보가 나와 있습니다.

  • 범위: [하한, 상한]

  • 값 형식: 정수, 연속(부동 소수점), 범주(부울, 목록, 문자열)

이름 설명
Freshness

신선도 계수는 항목의 최신 상태를 나타냅니다. 신선도는 CREATION_TIMESTAMP를 기반으로 항목의 수명을 정규화하여 계산됩니다. 신선도 인수를 사용하려면 항목 데이터 세트 스키마에 CREATION_TIMESTAMP 필드를 포함해야 합니다. 신선도 계수 값이 높을수록 의미상 유사한 권장 사항 중에서 최신 항목의 우선 순위가 지정됩니다.

기본값: 0.0

범위: [0.0, 1.0]

값 유형: Double

인기도

인기도 계수는 사용자 상호 작용을 기반으로 항목이 얼마나 인기가 있는지를 나타냅니다. 인기도는 각 항목이 수신한 상호 작용 수를 정규화하여 계산됩니다. 인기 계수를 사용하려면 데이터세트 그룹을 생성할 때 상호작용 데이터세트를 포함해야 합니다. 인기도 요소의 값이 높을수록 의미상 유사한 권장 사항 중에서 고객 상호 작용이 더 많은 항목의 우선 순위가 지정됩니다.

기본값: 0.0

범위: [0.0, 1.0]

값 유형: Double

신선도 및 인기도 점수는 훈련 시 계산되며 증분 업데이트는 인기도 및 신선도 점수를 업데이트하지 않습니다. 추천 항목의 순위에 영향을 미치는 가장 최근의 인기도 및 신선도 요인을 보려면 자동 재학습을 사용하거나 솔루션을 수동으로 재학습하고 캠페인을 새 솔루션 버전으로 업데이트합니다.