LightGBM - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

LightGBM

LightGBM は、よく知られた効率的な勾配ブースト決定木アルゴリズムのオープンソースを実装したものです。GBDT は、一連のより単純でより弱いモデルから得られた推定のアンサンブルを組み合わせることで、ターゲット変数の正確な予測を試みる、教師あり学習アルゴリズムです。LightGBM は、追加の手法を使用し、従来の GBDT の効率とスケーラビリティを大幅に向上させています。このページには、LightGBM の Amazon EC2 インスタンスに関する推奨事項とサンプルノートブックについての情報が含まれています。

LightGBM アルゴリズムの Amazon EC2 インスタンスに関する推奨事項

現在、SageMaker AI LightGBM は、単一インスタンスとマルチインスタンスの CPU トレーニングをサポートしています。マルチインスタンスの CPU トレーニング (分散トレーニング) の場合、推定器を定義するときに 1 より大きい instance_count を指定します。LightGBM を使用した分散トレーニングの詳細については、「Amazon SageMaker AI LightGBM Distributed training using Dask」を参照してください。

LightGBM は (CPU バウンドではなく) メモリバウンドアルゴリズムです。そのため、コンピューティング最適化インスタンス (C5 など) よりも汎用コンピューティングインスタンス (M5 など) を選択することをお勧めします。さらに、トレーニングデータを保持するために、選択したインスタンスに十分なメモリを用意することを推奨します。

LightGBM サンプルノートブック

次の表は、Amazon SageMaker AI LightGBM アルゴリズムのさまざまなユースケースに対応する各種サンプルノートブックの概要を示しています。

ノートブックのタイトル 説明

Tabular classification with Amazon SageMaker AI LightGBM and CatBoost algorithm

このノートブックでは、Amazon SageMaker AI LightGBM アルゴリズムを使用して表形式の分類モデルをトレーニングおよびホストする方法について説明しています。

Tabular regression with Amazon SageMaker AI LightGBM and CatBoost algorithm

このノートブックでは、Amazon SageMaker AI LightGBM アルゴリズムを使用して表形式のリグレッションモデルをトレーニングおよびホストする方法について説明しています。

Amazon SageMaker AI LightGBM Distributed training using Dask

このノートブックは、Dask フレームワークを使用した Amazon SageMaker AI LightGBM アルゴリズムによる分散トレーニングについて説明しています。

SageMaker AI でサンプルを実行するために使用できる Jupyter ノートブックインスタンスを作成してアクセスする方法の詳細については、「Amazon SageMaker ノートブックインスタンス」を参照してください。ノートブックインスタンスを作成して開いた後、[SageMaker AI サンプル] タブを選択して、すべての SageMaker AI サンプルのリストを表示します。ノートブックを開くには、その [Use (使用)] タブを選択し、[Create copy (コピーを作成)] を選択します。