

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 準備用於訓練的使用者中繼資料
<a name="users-datasets"></a>

 您可以匯入 Amazon Personalize 的使用者資料包括數值資料，例如使用者年齡和分類中繼資料，例如性別或忠誠度成員資格。您可以將有關使用者的中繼資料匯入 Amazon Personalize *使用者資料集*。

根據您的網域使用案例或自訂配方，使用者中繼資料可協助 Amazon Personalize 向使用者建議更相關的項目，或建議更有意義的使用者客群。在訓練之後，它可以協助您的模型為沒有任何互動資料的使用者建議項目。如需哪些使用案例或配方使用使用者中繼資料的詳細資訊，請參閱 中網域使用案例或配方的資料需求[將您的使用案例與 Amazon Personalize 資源配對](use-cases-and-recipes.md)。

 訓練時，Amazon Personalize 不會使用非分類字串使用者資料，例如使用者名稱、有關使用者的關鍵字或標籤。不過，匯入此資料仍然可以增強建議。如需詳細資訊，請參閱[非分類字串資料](#user-string-data)。

對於所有網域使用案例和自訂配方，您的大量使用者資料必須位於 CSV 檔案中。檔案中的每一列都應該代表唯一的使用者。完成資料準備後，您就可以建立結構描述 JSON 檔案。此檔案會告知 Amazon Personalize 您資料的結構。如需詳細資訊，請參閱[為 Amazon Personalize 結構描述建立結構描述 JSON 檔案](how-it-works-dataset-schema.md)。

下列各節提供如何準備 Amazon Personalize 使用者資料的詳細資訊。如需所有資料類型的大量資料格式準則，請參閱[大量資料格式準則](preparing-training-data.md#general-formatting-guidelines)

**Topics**
+ [使用者資料需求](#user-data-requirements)
+ [分類中繼資料](#user-categorical-data)
+ [非分類字串資料](#user-string-data)
+ [使用者中繼資料範例](#users-data-example)

## 使用者資料需求
<a name="user-data-requirements"></a>

 以下是 Amazon Personalize 的使用者資料需求。您可以根據您的使用案例和資料，自由新增其他自訂資料欄。
+ 您的資料必須有一個 USER\_ID 資料欄，可存放每個使用者的唯一識別符。每個使用者都必須有使用者 ID。它必須是長度`string`上限為 256 個字元的 。
+ 您的資料必須至少有一個分類字串或數值中繼資料欄。使用者中繼資料資料欄可以包含某些使用者的空白/空值。我們建議這些資料欄至少完成 70%。
+ 中繼資料資料欄的數量上限為 25。

如果您不確定自己的資料是否足夠，或對資料品質有任何疑問，您可以將資料匯入 Amazon Personalize 資料集，並使用 Amazon Personalize 進行分析。如需詳細資訊，請參閱[分析 Amazon Personalize 資料集中的資料品質和數量](analyzing-data.md)。

## 分類中繼資料
<a name="user-categorical-data"></a>

在某些配方和所有網域使用案例中，Amazon Personalize 會在識別基礎模式時，使用分類中繼資料，例如使用者的性別、興趣或成員資格狀態，以向使用者顯示最相關的項目。您可以根據使用案例定義自己的值範圍。分類中繼資料可以是任何語言。

對於具有多個類別的使用者，請以垂直長條 '\|' 分隔每個值。例如，對於 INTERESTS 欄位，使用者的資料可能是 `Movies|TV Shows|Music`。

透過所有配方和網域，您可以匯入分類中繼資料，並根據使用者的屬性來篩選建議。如需篩選建議的相關資訊，請參閱 [篩選建議和使用者客群](filter.md)。

分類值最多可有 1000 個字元。如果您有分類值超過 1000 個字元的使用者，您的資料集匯入任務將會失敗。

## 非分類字串資料
<a name="user-string-data"></a>

 除了使用者 IDs 之外，Amazon Personalize 不會在訓練時使用非分類字串資料，例如使用者名稱、有關使用者的關鍵字或標籤。不過，Amazon Personalize 可以在篩選建議時使用它。您可以建立篩選條件，根據取得建議之使用者 (CurrentUser) 的非分類字串資料，從建議中包含或移除項目。如需篩選條件的詳細資訊，請參閱[篩選建議和使用者客群](filter.md)。非分類值最多可有 1000 個字元。

## 使用者中繼資料範例
<a name="users-data-example"></a>

CSV 檔案中的前幾行使用者中繼資料可能如下所示。

```
USER_ID,AGE,GENDER,INTEREST
5,34,Male,hiking
6,56,Female,music
8,65,Male,movies|TV shows|music
...
...
```

資料`USER_ID`欄為必要欄位，並存放每個個別使用者的唯一識別符。資料`AGE`欄是數值中繼資料。`GENDER` 和 `INTEREST`資料欄會儲存每個使用者的分類中繼資料。

完成資料準備後，您就可以建立結構描述 JSON 檔案。此檔案會告知 Amazon Personalize 您資料的結構。如需詳細資訊，請參閱[為 Amazon Personalize 結構描述建立結構描述 JSON 檔案](how-it-works-dataset-schema.md)。這是上述範例資料結構描述 JSON 檔案的外觀。

```
{
  "type": "record",
  "name": "Users",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
      {
          "name": "USER_ID",
          "type": "string"
      },
      {
          "name": "AGE",
          "type": "int"
      },
      {
          "name": "GENDER",
          "type": "string",
          "categorical": true
      },
      {
          "name": "INTEREST",
          "type": "string",
          "categorical": true
      }
  ],
  "version": "1.0"
}
```