

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 轉換資料
<a name="dw-transform-data"></a>

 若要在 Data Wrangler 中轉換資料，請將**轉換**步驟新增至資料流程。Data Wrangler 包含超過 300 個可用於準備資料的轉換，包括 **Amazon Personalize 轉換的映射資料欄**。您也可以使用一般 Data Wrangler 轉換來修正異常值、類型問題和遺失值等問題。

完成資料轉換後，您可以使用 Data Wrangler 分析資料。或者，如果您已完成在 Data Wrangler 中準備資料，您可以處理資料並將其匯入 Amazon Personalize。如需分析資料的資訊，請參閱 [產生視覺化和資料洞見](dw-analyze-data.md)。如需處理和匯入資料的資訊，請參閱 [處理資料並將其匯入 Amazon Personalize](dw-export-data.md)。

**Topics**
+ [Amazon Personalize 的映射資料欄](#dw-personalize-transform)
+ [一般資料 Wrangler 轉換](#dw-general-transform)

## Amazon Personalize 的映射資料欄
<a name="dw-personalize-transform"></a>

 若要轉換資料以符合 Amazon Personalize 需求，您可以新增 **Amazon Personalize 轉換的映射資料欄**，並將資料欄映射至 Amazon Personalize 的必要和選用欄位。

**使用 Amazon Personalize 轉換的映射資料欄**

1.  為您的最新轉換選擇 **\$1**，然後選擇**新增轉換**。如果您尚未新增轉換，請為**資料類型**轉換選擇 **\$1**。Data Wrangler 會自動將此轉換新增至您的流程。

1.  選擇**新增步驟**。

1.  選擇 **Amazon Personalize 的轉換**。預設會選取 **Amazon Personalize 轉換的映射資料欄**。

1. 使用轉換欄位將您的資料映射至必要的 Amazon Personalize 屬性。

   1. 選擇符合您資料的資料集類型 （互動、項目或使用者）。

   1. 選擇您的網域 (ECOMMERCE、VIDEO\$1ON\$1DEMAND 或自訂）。您選擇的網域必須符合您在建立資料集群組時指定的網域。

   1. 選擇符合 Amazon Personalize 必要和選用欄位的資料欄。例如，針對 item\$1ID 資料欄，選擇資料中存放每個項目唯一識別資訊的資料欄。

      每個資料欄欄位都會依資料類型篩選。只有您資料中符合 Amazon Personalize 資料類型需求的資料欄可用。如果您的資料不是必要的類型，您可以使用[剖析值作為類型](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) Data Wrangler 轉換來轉換它。

## 一般資料 Wrangler 轉換
<a name="dw-general-transform"></a>

 下列一般 Data Wrangler 轉換可協助您準備 Amazon Personalize 的資料：
+ 資料類型轉換：如果您的欄位未列為 **Amazon Personalize 轉換的映射資料欄中**的可能選項，您可能需要轉換其資料類型。Data Wrangler [將剖析值轉換為類型](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type)，可協助您轉換資料。或者，您可以在建立流程時，使用 Data Wrangler 預設新增的**資料類型**轉換。若要使用此轉換，請從類型****下拉式清單中選擇資料類型，選擇**預覽**，然後選擇**更新**。

   如需欄位所需資料類型的資訊，請參閱 中網域和資料集類型的一節[為 Amazon Personalize 結構描述建立結構描述 JSON 檔案](how-it-works-dataset-schema.md)。
+ 處理遺失值和極端值：如果您產生遺失值或極端值洞見，您可以使用 Data Wrangler 轉換[處理極端值](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-outlier)和[處理遺失值](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-missing)來解決這些問題。
+  自訂轉換：使用 Data Wrangler，您可以使用 Python （使用者定義函數）、PySpark、Pandas 或 PySpark (SQL) 建立自己的轉換。您可以使用自訂轉換來執行任務，例如捨棄重複的資料欄或依資料欄分組。如需詳細資訊，請參閱《*Amazon SageMaker AI 開發人員指南*》中的[自訂轉換](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-custom)。