

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# データフローのサンプリング設定を編集する
<a name="canvas-data-flow-edit-sampling"></a>

表形式データを Data Wrangler データフローにインポートする際は、データセットのサンプルを取得して、データの探索とクリーニングプロセスを高速化できます。データセットのサンプルで探索的変換を実行することは、データセット全体で変換を実行するよりも高速であることが多く、データセットをエクスポートしてモデルを構築する準備ができたら、変換をデータセット全体に適用できます。

Canvas は、次のサンプリング方法をサポートしています。
+ **FirstK** – Canvas はデータセットから最初の *K* 項目を選択します。ここで、*K* は指定した数値を表します。このサンプリング方法は単純ですが、データセットがランダムに順序付けられていない場合、バイアスが発生する可能性があります。
+ **ランダム** – Canvas は項目をデータセットからランダムに選択します。各項目は同じ確率で選択されます。このサンプリング方法は、サンプルがデータセット全体を確実に表すようにする上で役立ちます。
+ **層別化** – Canvas は、1 つ以上の属性 (年齢や所得レベルなど) に基づいてデータセットをグループ (つまり*階層*) に分割します。次に、比例した数の項目が各グループからランダムに選択されます。この方法では、関連するすべてのサブグループがサンプルに適切に含まれます。

サンプリング設定は随時編集して、データ探索に使用するサンプルのサイズを変更できます。

サンプリング設定を変更するには、次の手順に従います。

1. データフローグラフで、データソースノードを選択します。

1. 下部のナビゲーションバーで **[サンプリング]** を選択します。

1. **[サンプリング]** ダイアログボックスが開きます。**[サンプリング方法]** ドロップダウンで、目的のサンプリング方法を選択します。

1. **[最大サンプルサイズ]** には、サンプリングする行数を入力します。

1. **[更新]** を選択して変更を保存します。

これで、サンプリング設定の変更が適用されます。