LightGBM - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

LightGBM

LightGBM 是梯度提升决策树 (GBDT) 算法的一种热门的开源实施,效率非常出色。GBDT 是一种有监督学习算法,它尝试将一组较简单且较弱模型的一系列估计值结合在一起,从而准确地预测目标变量。LightGBM 使用额外的技术来显著提高传统 GBDT 的效率和可扩展性。本页面包含有关 Amazon EC2 实例推荐功能和 LightGBM 笔记本示例的信息。

适用于 LightGBM 算法的 Amazon EC2 实例推荐

SageMaker AI LightGBM 目前支持单实例和多实例 CPU 训练。对于多实例 CPU 训练(分布式训练),请在定义估算器时指定大于 1 的 instance_count。有关使用 LightGBM 进行分布式训练的更多信息,请参阅使用 Dask 进行 Amazon SageMaker AI LightGBM 分布式训练

LightGBM 是一种内存限制型(而不是计算限制型)算法。因此,通用计算实例(例如 M5)是比计算优化型实例(例如 C5)更适合的选择。此外,我们建议您在选定的实例中有足够的总内存来保存训练数据。

LightGBM 示例笔记本

下表概述了解决 Amazon SageMaker AI LightGBM 算法的不同使用案例的各种示例笔记本。

笔记本标题 描述

使用 Amazon SageMaker AI LightGBM 和 CatBoost 算法进行表格分类

本笔记本演示了如何使用 Amazon SageMaker AI LightGBM 算法来训练和托管表格分类模型。

使用 Amazon SageMaker AI LightGBM 和 CatBoost 算法进行表格回归

本笔记本演示了如何使用 Amazon SageMaker AI LightGBM 算法来训练和托管表格回归模型。

使用 Dask 进行 Amazon SageMaker AI LightGBM 分布式训练

本笔记本演示了使用 Dask 框架,通过 Amazon SageMaker AI LightGBM 算法进行分布式训练。

有关如何创建和访问可用于在 SageMaker AI 中运行示例的 Jupyter Notebook 实例的说明,请参阅 Amazon SageMaker 笔记本实例。创建笔记本实例并将其打开后,选择 SageMaker AI 示例选项卡以查看所有 SageMaker AI 示例的列表。要打开笔记本,请选择其使用选项卡,然后选择创建副本