

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# データ変換
<a name="dw-transform-data"></a>

 Data Wrangler でデータを変換するには、データフローに**変換**ステップを追加します。Data Wrangler には、**Amazon Personalize マップ列**変換など、データの準備に使用できる 300 を超える変換が含まれています。また、一般的な Data Wrangler 変換を使用して、外れ値、型の問題、欠損値などの問題を修正できます。

データの変換が完了したら、Data Wrangler で分析できます。または、Data Wrangler でデータを準備し終えたら、そのデータを処理して Amazon Personalize にインポートできます。データの分析については、「[ビジュアライゼーションとデータインサイトの生成](dw-analyze-data.md)」を参照してください。データの処理とインポートについては、「[データを処理して Amazon Personalize にインポートする](dw-export-data.md)」を参照してください。

**Topics**
+ [Amazon Personalize マッピング列](#dw-personalize-transform)
+ [一般的な Data Wrangler 変換](#dw-general-transform)

## Amazon Personalize マッピング列
<a name="dw-personalize-transform"></a>

 Amazon Personalize の要件を満たすようにデータを変換するには、**Amazon Personalize のマップ列**変換を追加し、その列を Amazon Personalize の必須フィールドとオプションフィールドにマッピングします。

**Amazon Personalize のマップ列変換を使用するには**

1.  最新の変換に **[\$1]** を選択し、**[変換を追加]** を選択します。変換をまだ追加していない場合は、**データ型**変換に **[\$1]** を選択してください。Data Wrangler は、この変換をフローに自動的に追加します。

1.  **[Add step]** (ステップを追加) を選択します。

1.  **[Amazon Personalize の変換]** を選択してください。**Amazon Personalize のマップ列**変換はデフォルトで選択されています。

1. 変換フィールドを使用して、データを必要な Amazon Personalize 属性にマッピングします。

   1. データに一致するデータセットタイプ (インタラクション、アイテム、ユーザー) を選択します。

   1. ドメイン (Eコマース、VIDEO\$1ON\$1DEMAND、またはカスタム) を選択します。選択するドメインは、データセットグループを作成したときに指定したドメインと一致する必要があります。

   1. Amazon Personalize の必須フィールドとオプションフィールドに一致する列を選択してください。例えば、item\$1ID 列では、各商品の固有識別情報を格納するデータ内の列を選択します。

      各列フィールドはデータタイプによってフィルタ処理されます。Amazon Personalize のデータ型要件を満たすデータ内の列のみを使用できます。データが必要なタイプでない場合は、[Parse Value as Type](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) Data Wrangler 変換を使用して変換できます。

## 一般的な Data Wrangler 変換
<a name="dw-general-transform"></a>

 以下の一般的な Data Wrangler 変換は、Amazon Personalize 用のデータを準備するのに役立ちます。
+ データ型変換: **Amazon Personalizeのマップ列**変換に使用可能なオプションとしてフィールドが表示されていない場合は、そのデータ型を変換する必要がある場合があります。Data Wrangler 変換の [Parse Value as Type](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) は、データの変換に役立ちます。また、フローの作成時に Data Wrangler がデフォルトで追加する**データ型**変換を使用することもできます。この変換を使用するには、**[タイプ]** ドロップダウンリストからデータタイプを選択し、**[プレビュー]**を選択してから**[更新]**を選択します。

   フィールドに必要なデータ型については、「[Amazon Personalize スキーマのスキーマ JSON ファイルの作成](how-it-works-dataset-schema.md)」でドメインとデータセットタイプのセクションを参照してください。
+ 欠損値と外れ値の処理:欠損値や外れ値のインサイトを生成した場合は、Data Wrangler 変換「[外れ値の処理](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-outlier)と[欠損値の処理](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-missing)を使用してこれらの問題を解決できます。
+  カスタム変換: Data Wrangler を使用すると、Python (ユーザー定義関数)、PySpark、pandas、または PySpark (SQL) を使用して独自の変換を作成できます。カスタム変換を使用して、重複する列の削除や列によるグループ化などのタスクを実行できます。詳細については、「*Amazon SageMaker AI デベロッパーガイド*」の「[カスタム変換](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-custom)」を参照してください。