CatBoost - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

CatBoost

O CatBoost é uma implementação de código aberto amplamente conhecida de alto desempenho do algoritmo de árvore de decisão com aumento de gradiente (Gradient Boosting Decision Tree, GBDT). GBDT é um algoritmo de aprendizado supervisionado que tenta prever com precisão uma variável de destino. Para isso, combina um grupo de estimativas de um conjunto de modelos mais simples e mais fracos.

O CatBoost apresenta dois avanços algorítmicos críticos para GBDT:

  1. A implementação do aumento ordenado, uma alternativa baseada em permutação ao algoritmo clássico

  2. Um algoritmo inovador para processar atributos categóricos

Ambas as técnicas foram criadas para combater uma mudança de predição causada por um tipo especial de vazamento de alvo presente em todas as implementações atualmente existentes de algoritmos de aumento de gradiente. Esta página inclui informações sobre recomendações de instâncias do Amazon EC2 e cadernos de exemplos do CatBoost.

Recomendações de instâncias do Amazon EC2 para o algoritmo do CatBoost

No momento, o CatBoost do SageMaker AI usa apenas CPUs para o treinamento. CatBoost é um algoritmo de uso intensivo de memória (ao contrário dos de uso intensivo de computação). Portanto, uma instância de computação de uso geral (por exemplo, M5) é uma opção melhor do que uma instância otimizada para computação (por exemplo, C5). Além disso, recomendamos que você tenha memória total suficiente em instâncias específicas para armazenar os dados de treinamento.

Cadernos de exemplo do CatBoost

A tabela a seguir descreve uma variedade de cadernos de exemplo que abordam diferentes casos de uso do algoritmo CatBoost do Amazon SageMaker AI.

Título do caderno Descrição

Classificação tabular com o LightGBM e o algoritmo CatBoost do Amazon SageMaker AI

Este caderno demonstra o uso do algoritmo CatBoost do Amazon SageMaker AI para treinar e hospedar um modelo de classificação tabular.

Regressão tabular com o LightGBM e o algoritmo CatBoost do Amazon SageMaker AI

Este caderno demonstra o uso do algoritmo CatBoost do Amazon SageMaker AI para treinar e hospedar um modelo de regressão tabular.

Para obter instruções sobre como criar e acessar instâncias de caderno Jupyter que podem ser usadas para executar o exemplo no SageMaker AI, consulte Instâncias de SageMaker notebook da Amazon. Depois de criar uma instância de caderno e abri-la, selecione a guia Exemplos do SageMaker AI para ver uma lista de todas os exemplos do SageMaker AI. Para abrir um caderno, escolha a guia Uso e depois escolha Criar cópia.