Amazon Machine Learning サービスの更新や、その新しいユーザーの受け入れは行っていません。このドキュメントは既存のユーザー向けに提供されていますが、更新は終了しています。詳細については、「[Amazon Machine Learning とは](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html)」を参照してください。

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ステップ 1: データを準備する
<a name="step-1-download-edit-and-upload-data"></a>

機械学習では、通常はデータを取得し、トレーニングを開始する前にそれが正しくフォーマットされていることを確認します。このチュートリアルのために、サンプルデータセットを [UCI Machine Learning リポジトリ](http://archive.ics.uci.edu/ml/)から取得し、Amazon ML ガイドラインに準拠するようフォーマットし、ダウンロードできるようにしました。このトピックの手順に従って、データセットを Amazon Simple Storage Service (Amazon S3) ストレージの場所からダウンロードし、自分の S3 バケットにアップロードしてください。

 Amazon ML フォーマット要件については、「[Amazon ML のデータ形式について](understanding-the-data-format-for-amazon-ml.md)」を参照してください。

**データセットをダウンロードするには**

1. [banking.zip](samples/banking.zip) をクリックして、あなたの銀行の定期預金に似ている製品を購入したお客様の履歴データが保存されているファイルをダウンロードします。フォルダーを解凍し、banking.csv ファイルをコンピュータに保存します。

1.  [banking-batch.zip](samples/banking-batch.zip) をクリックして、可能性のある顧客が提供に反応するかどうかの予測に使用するファイルをダウンロードします。フォルダーを解凍し、banking-batch.csv ファイルをコンピュータに保存します。

1.  `banking.csv` を開きます。データの行と列が表示されます。*ヘッダー行* には、各列の属性名が含まれています。*属性* は一意の指名プロパティで、各カスタマーの特定の特性を記述するもので、たとえば nr\_employed ならカスタマーの雇用状態を表します。各行は、単一のカスタマーに関する観測のコレクションを表します。  
![データ行の上に列名が euribor3m、nr_employed、y のヘッダー行を示す CSV ファイル。](http://docs.aws.amazon.com/ja_jp/machine-learning/latest/dg/images/image1.png)

   ML モデルに、「このカスタマーは新しい製品をサブスクライブしますか」という質問に答えてもらうとします。この質問への答えは `banking.csv` データセットの [**y**] 属性値で、値は 1 (はい) または 0 (いいえ) です。Amazon ML に予測方法を学習してもらいたい属性を、*ターゲット属性* と呼びます。
**注記**  
属性 [**y**] はバイナリ属性です。2 つの値のいずれか 1 つのみを含めることができ、この場合は 0 または 1 です。元の UCI データセットでは、**y** 属性は、[Yes] または [No] です。元のデータセットは編集されています。[**y**] 属性の yes を意味するすべての値が 1 に、no を意味するすべての値が 0 になっています。独自のデータを使用する場合は、バイナリ属性に他の値を使用することができます。有効な値の詳細については、「[AttributeType フィールドの使用](creating-a-data-schema-for-amazon-ml.md#assigning-data-types)」を参照してください。

 以下の例は、[**y**] 属性の値をバイナリ属性 0 および 1 に変更する前後のデータを示しています。

![y 値がはい/いいえから 1/0 に変換された euribor3m 列と nr_employed 列を示す CSV ファイル。](http://docs.aws.amazon.com/ja_jp/machine-learning/latest/dg/images/image2.png)


![列 euribor3m、nr_employed、y が表示された banking.csv ファイルを示すデータ変換。](http://docs.aws.amazon.com/ja_jp/machine-learning/latest/dg/images/image3.png)


 `banking-batch.csv` ファイルに [**y**] 属性は含まれていません。ML モデルを作成した後で、そのモデルを使用してファイル内の各レコードの [**y**] を予測します。

 次に、`banking.csv ` および `banking-batch.csv` ファイルを Amazon S3 にアップロードします。

**Amazon S3 の場所にファイルをアップロードするには**

1. にサインイン AWS マネジメントコンソール し、[https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/) で Amazon S3 コンソールを開きます。

1.  [**すべてのバケット**] リストで、バケットを作成するか、ファイルをアップロードする場所を選択します。

1. ナビゲーションバーで、[**アップロード**] を選択します。

1. [**Add Files**] を選択します。

1.  ダイアログボックスでデスクトップに移動してから `banking.csv` および `banking-batch.csv` を選択し、[**オープン**] を選択します。

 これで、[トレーニングデータソースを作成する](step-2-create-a-datasource.md) 準備ができました。