LightGBM - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

LightGBM

OLightGBM é uma conhecida e eficiente implementação de código aberto do algoritmo baseado em árvores com aumento de gradiente (Gradient Boosting Decision Tree, GBDT). GBDT é um algoritmo de aprendizado supervisionado que tenta prever com precisão uma variável de destino. Para isso, combina um grupo de estimativas de um conjunto de modelos mais simples e mais fracos. O LightGBM usa técnicas adicionais para melhorar significativamente a eficiência e a escalabilidade do GBDT convencional. Esta página inclui informações sobre recomendações de instâncias do Amazon EC2 e cadernos de exemplos do LightGBM.

Recomendações de instâncias do Amazon EC2 para o algoritmo do LightGBM

No momento, o LightGBM do SageMaker permite o treinamento de CPU de instância única e de várias instâncias. Para treinamento de CPU em várias instâncias (treinamento distribuído), especifique um valor instance_count maior que 1 ao definir seu Estimador. Para ter mais informações sobre treinamento distribuído com o LightGBM, consulte Treinamento distribuído do LightGBM do Amazon SageMaker AI usando o Dask.

LightGBM é um algoritmo de uso intensivo de memória (ao contrário dos de uso intensivo de computação). Portanto, uma instância de computação de uso geral (por exemplo, M5) é uma opção melhor do que uma instância otimizada para computação (por exemplo, C5). Além disso, recomendamos que você tenha memória total suficiente em instâncias específicas para armazenar os dados de treinamento.

Exemplos de cadernos LightGBM

A tabela a seguir descreve uma variedade de exemplos de caderno que abordam diferentes casos de uso do algoritmo LightGBM do Amazon SageMaker AI.

Título do caderno Descrição

Classificação tabular com o LightGBM e o algoritmo CatBoost do Amazon SageMaker AI

Este caderno demonstra o uso do algoritmo LightGBM do Amazon SageMaker AI para treinar e hospedar um modelo de classificação tabular.

Regressão tabular com o LightGBM e o algoritmo CatBoost do Amazon SageMaker AI

Este caderno demonstra o uso do algoritmo LightGBM do Amazon SageMaker AI para treinar e hospedar um modelo de regressão tabular.

Treinamento distribuído do LightGBM do Amazon SageMaker AI usando o Dask

Este caderno demonstra o treinamento distribuído com o algoritmo LightGBM do Amazon SageMaker AI usando o framework Dask.

Para obter instruções sobre como criar e acessar instâncias de caderno Jupyter que podem ser usadas para executar o exemplo no SageMaker AI, consulte Instâncias de SageMaker notebook da Amazon. Depois de criar uma instância de caderno e abri-la, selecione a guia Exemplos do SageMaker AI para ver uma lista de todas os exemplos do SageMaker AI. Para abrir um caderno, escolha a guia Uso e depois escolha Criar cópia.