翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon SageMaker AI Data Wrangler を使用したバルクデータの準備およびインポート
<a name="preparing-importing-with-data-wrangler"></a>

**重要**  
Data Wrangler を使用すると、SageMaker AI のコストが発生します。課金および料金の詳細な一覧については、「[Amazon SageMaker AI の料金](https://aws.amazon.com/sagemaker/pricing/)」の「Data Wrangler」タブを参照してください。追加料金が発生しないように、使用が終了したら Data Wrangler インスタンスをシャットダウンしてください。詳細については、「[Data Wrangler をシャットダウンする](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-shut-down.html)」を参照してください。

データセットグループを作成したら、Amazon SageMaker AI Data Wrangler (Data Wrangler) を使用して 40 以上のソースからデータを Amazon Personalize データセットにインポートできます。Data Wrangler は、データのインポート、準備、変換、分析を行う、エンドツーエンドのソリューションを提供する Amazon SageMaker AI Studio Classic の機能です。Data Wrangler を使用してデータを準備し、アクションデータセットまたはアクションインタラクションデータセットにインポートすることはできません。

 Data Wrangler を使用してデータを準備してインポートする場合は、データフローを使用します。*データフロー*は、データのインポートから始まる一連の機械学習データ準備ステップを定義します。フローにステップを追加するたびに、Data Wrangler はデータの変換やビジュアライゼーションの生成などのアクションをデータに対して実行します。

Amazon Personalize のデータを準備するためにフローに追加できるいくつかのステップを以下に示します。
+ **インサイト:** Amazon Personalize 固有のインサイトステップをフローに追加できます。これらのインサイトは、データについて、またデータを改善するために実行できるアクションについて知るのに役立ちます。
+ **ビジュアライゼーション:** ビジュアライゼーションステップを追加して、ヒストグラムや散布図などのグラフを生成できます。グラフは、外れ値や欠損値など、データ内の問題を発見するのに役立ちます。
+ **変換:** Amazon Personalize 固有の変換ステップと一般的な変換ステップを使用して、データが Amazon Personalize の要件を満たしていることを確認できます。Amazon Personalize 変換は、Amazon Personalize データセットタイプに応じてデータ列を必要な列にマッピングするのに役立ちます。

Amazon Personalize にデータをインポートする前に Data Wrangler を終了する必要がある場合は、[Amazon Personalize コンソールから Data Wrangler を起動する](dw-launch-dw-from-personalize.md)ときに同じデータセットタイプを選択することで、中断したところに戻ることができます。または、SageMaker AI Studio Classic から直接 Data Wrangler にアクセスすることもできます。

 以下のように、Data Wrangler から Amazon Personalize にデータをインポートすることをお勧めします。変換、視覚化、分析のステップはオプションで繰り返し可能で、どの順序でも実行できます。

1. **[アクセス許可の設定](dw-data-prep-minimum-permissions.md)** – Amazon Personalize サービスロールと SageMaker AI サービスロールのアクセス許可を設定します。そして、ユーザーの許可を設定します。

1. **[Amazon Personalize コンソールから SageMaker AI Studio Classic で Data Wrangler を起動](dw-launch-dw-from-personalize.md)** – Amazon Personalize コンソールを使用して SageMaker AI ドメインを設定し、SageMaker AI Studio Classic で Data Wrangler を起動します。

1. **[Data Wrangler へのデータのインポート](dw-import-data.md)** - 40 以上のソースから Data Wrangler にデータをインポートします。ソースには、Amazon Redshift、Amazon EMR、Amazon Athena などの AWS サービスや、Snowflake や DataBricks などのサードパーティーが含まれます。

1. **[データの変換](dw-transform-data.md)** - Data Wrangler を使用して、Amazon Personalize の要件を満たすようにデータを変換します。

1. **[データの視覚化と分析](dw-analyze-data.md)** - Data Wrangler を使用してデータを視覚化し、Amazon Personalize 固有のインサイトを通じて分析します。

1. **[データの処理と Amazon Personalize へのインポート](dw-export-data.md)** – SageMaker AI Studio Classic Jupyter Notebook を使用して、処理したデータを Amazon Personalize にインポートします。

## 追加情報
<a name="dw-additional-info"></a>

以下のリソースは、Amazon SageMaker AI Data Wrangler と Amazon Personalize の使用に関する追加情報を提供します。
+ サンプルデータセットの処理と変換を説明するチュートリアルについては、「*Amazon SageMaker AI デベロッパーガイド*」の「[デモ: Data Wrangler Titanic データセットのチュートリアル](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-getting-started.html#data-wrangler-getting-started-demo)」を参照してください。このチュートリアルでは、Data Wrangler のフィールドと機能を紹介します。
+ Amazon SageMaker AI ドメインへのオンボーディングについては、「*Amazon SageMaker AI デベロッパーガイド*」の「[Quick onboard to Amazon SageMaker AI Domain](https://docs.aws.amazon.com/sagemaker/latest/dg/onboard-quick-start.html)」を参照してください。
+ Amazon Personalize データの要件については、「[Amazon Personalize のトレーニングデータの準備](preparing-training-data.md)」を参照してください。