翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# LightGBM ハイパーパラメータ
<a name="lightgbm-hyperparameters"></a>

次の表には、Amazon SageMaker AI LightGBM アルゴリズムに必要な、または最も一般的に使用されるハイパーパラメータのサブセットが含まれています。ユーザーは、データからモデルパラメータを推定しやすくするために、これらのパラメータを設定します。SageMaker AI LightGBM アルゴリズムは、オープンソースの [LightGBM](https://github.com/microsoft/LightGBM) パッケージの実装です。

**注記**  
デフォルトのハイパーパラメータは、[LightGBM サンプルノートブック](lightgbm.md#lightgbm-sample-notebooks) のサンプルデータセットに基づいています。

デフォルトでは、SageMaker AI LightGBM アルゴリズムは分類問題のタイプに基づいて自動的に評価指標と目的関数を選択します。LightGBM アルゴリズムは、データ内のラベルの数に基づいて分類問題のタイプを検出します。リグレッションの問題の場合、評価指標は二乗平均平方根誤差で、目的関数は L2 損失です。二項分類の問題の場合は、評価指標と目的関数はどちらも二項交差エントロピーです。多クラス分類の問題の場合、評価指標は多クラス交差エントロピーで、目的関数はソフトマックスです。`metric` ハイパーパラメータを使用して、デフォルトの評価メトリクスを変更できます。説明、有効値、およびデフォルト値など、LightGBM ハイパーパラメータの詳細については、次の表を参照してください。


| Parameter Name | 説明 | 
| --- | --- | 
| num\$1boost\$1round |  ブースティングの反復の最大数。**注意:** LightGBM は複数クラス分類問題に対して内部的に `num_class * num_boost_round` ツリーを構築します。 有効な値: 整数、範囲:正の整数。 デフォルト値: `100`。  | 
| early\$1stopping\$1rounds |  ある検証データポイントの 1 つのメトリクスが最後の `early_stopping_rounds` ラウンドで改善されない場合、トレーニングは停止します。`early_stopping_rounds` が 0 以下の場合、このハイパーパラメータは無視されます。 有効な値: 整数。 デフォルト値: `10`。  | 
| metric |  検証データの評価メトリクス。`metric` がデフォルトの `"auto"` 値に設定されている場合、アルゴリズムは分類問題のタイプに基づいて自動的に評価メトリクスを選択します。 [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/lightgbm-hyperparameters.html) 有効な値: 文字列、次のいずれか: (`"auto"`、`"rmse"`、`"l1"`、`"l2"`、`"huber"`、`"fair"`、`"binary_logloss"`、`"binary_error"`、`"auc"`、`"average_precision"`、`"multi_logloss"`、`"multi_error"`、`"auc_mu"`、または `"cross_entropy"`)。 デフォルト値: `"auto"`。  | 
| learning\$1rate |  トレーニング例の各バッチを完了した後に、モデルの重みが更新されるレート。 有効な値: 浮動小数点、範囲: (`0.0`, `1.0`)。 デフォルト値: `0.1`。  | 
| num\$1leaves |  あるツリーの葉の最大数。 有効な値: 整数、範囲: (`1`, `131072`)。 デフォルト値: `64`。  | 
| feature\$1fraction |  各反復 (ツリー) で選択される特徴量のサブセット。1.0 未満にする必要があります。 有効な値: 浮動小数点、範囲: (`0.0`, `1.0`)。 デフォルト値: `0.9`。  | 
| bagging\$1fraction |  `feature_fraction` に類似した特徴量のサブセットですが、`bagging_fraction` はリサンプリングなしでランダムにデータの一部を選択します。 有効な値: 浮動小数点、範囲: (`0.0`, `1.0`)。 デフォルト値: `0.9`。  | 
| bagging\$1freq |  バギングを実行する頻度。LightGBM は `bagging_freq` 反復のたびに、次の `bagging_freq` 反復に使用するデータのパーセンテージをランダムに選択します。このパーセンテージは `bagging_fraction` ハイパーパラメータによって決定されます。`bagging_freq` が 0 の場合、バギングは無効になります。 有効な値: 整数、範囲: 負以外の整数。 デフォルト値: `1`。  | 
| max\$1depth |  ツリーモデルの最大深度。これはデータの量が少ない場合のオーバーフィットを処理するのに使われます。`max_depth` が 0 以下の場合は、最大深度に制限がないことを意味します。 有効な値: 整数。 デフォルト値: `6`。  | 
| min\$1data\$1in\$1leaf |  1 つの葉に含まれるデータの最小量。オーバーフィットの処理にも使われます。 有効な値: 整数、範囲: 負以外の整数。 デフォルト値: `3`。  | 
| max\$1delta\$1step |  ツリーの葉の最大出力を制限するのに使用されます。`max_delta_step` が 0 以下の場合、制約はありません。葉の最終的な最大出力は `learning_rate * max_delta_step` です。 有効な値: 浮動小数点数。 デフォルト値: `0.0`。  | 
| lambda\$1l1 |  L1 正規化。 有効な値: 浮動小数点数、範囲: 負以外の浮動小数点数。 デフォルト値: `0.0`。  | 
| lambda\$1l2 |  L2 正規化。 有効な値: 浮動小数点数、範囲: 負以外の浮動小数点数。 デフォルト値: `0.0`。  | 
| boosting |  ブースティングの種類 有効な値: 文字列、次のいずれか: (`"gbdt"`、`"rf"`、`"dart"`、または `"goss"`) デフォルト値: `"gbdt"`。  | 
| min\$1gain\$1to\$1split |  分割を実行するための最小ゲイン。トレーニングの高速化に使われます。 有効な値: 整数、浮動小数点数: 負以外の浮動小数点数。 デフォルト値: `0.0`。  | 
| scale\$1pos\$1weight |  正のクラスを持つラベルの重み。二項分類タスクにのみ使用されます。`is_unbalance` が `"True"` に設定されている場合、`scale_pos_weight` は使用できません。 有効な値: 浮動小数点数、範囲: 正の浮動小数点数 デフォルト値: `1.0`。  | 
| tree\$1learner |  ツリーの線形の種類。 有効な値: 文字列、次のいずれか: (`"serial"`、`"feature"`、`"data"`、または `"voting"`)。 デフォルト値: `"serial"`。  | 
| feature\$1fraction\$1bynode |  各ツリーノードのランダムな特徴量のサブセットを選択します。例えば、`feature_fraction_bynode` が `0.8` の場合、特徴量の 80% が選択されます。オーバーフィットの処理にも使われます。 有効な値: 整数、範囲: (`0.0`,`1.0`]。 デフォルト値: `1.0`。  | 
| is\$1unbalance |  トレーニングデータが不均衡な場合は、`"True"` に設定します。二項分類タスクにのみ使用されます。`is_unbalance` は `scale_pos_weight` では使用できません。 有効な値: 文字列、次のいずれか: (`"True"` または `"False"`) デフォルト値: `"False"`。  | 
| max\$1bin |  特徴量の値をバケット化するために使用するビンの最大数。ビンの数が少ないとトレーニングの精度は低下することがありますが、一般的なパフォーマンスは向上する可能性があります。オーバーフィットの処理にも使われます。 有効な値: 整数、範囲: (1, ∞)。 デフォルト値: `255`。  | 
| tweedie\$1variance\$1power |  Tweedie 分布の分散を制御します。これを `2.0` に近づけると、ガンマ分布にシフトします。これを `1.0` に近づけると、ポアソン分布にシフトします。リグレッションタスクにのみ使用されます。 有効な値: 浮動小数点数、範囲: [`1.0`, `2.0`)。 デフォルト値: `1.5`。  | 
| num\$1threads |  LightGBM の実行に使用される並列スレッドの数。値 0 は、OpenMP のデフォルトスレッド数を意味します。 有効な値: 整数、範囲: 負以外の整数。 デフォルト値: `0`。  | 
| verbosity |  出力メッセージの詳細。`verbosity` が `0` よりも小さい場合、出力メッセージには致命的なエラーのみ表示されます。`verbosity` が `0` に設定されている場合、出力メッセージにはエラーと警告が含まれます。`verbosity` が `1` の場合、出力メッセージには詳細情報が表示されます。`verbosity` が `1` より大きい場合、出力メッセージには詳細情報が表示され、デバッグに使用できます。 有効な値: 整数。 デフォルト値: `1`。  |