CatBoost - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CatBoost

CatBoost est une implémentation open source populaire et hautement performante de l'algorithme d'arbre de décision avec renforcement de gradient (algorithme GBDT). L'algorithme GBDT est un algorithme d'apprentissage supervisé qui tente de prédire avec précision une variable cible en combinant un ensemble d'estimations à partir d'un jeu de modèles plus simples et plus faibles.

CatBoost introduit deux avancées algorithmiques critiques par rapport aux algorithmes GBDT :

  1. L'implémentation d'un renforcement ordonné, une alternative à l'algorithme classique axée sur la permutation

  2. Un algorithme innovant pour le traitement des caractéristiques catégorielles

Les deux techniques ont été créées pour lutter contre un changement de prédiction causé par un type particulier de fuite de cible présent dans toutes les implémentations existantes des algorithmes avec renforcement de gradient. Cette page contient des informations sur les recommandations relatives aux instances Amazon EC2 et des exemples de blocs-notes pour CatBoost.

Recommandation d'instances Amazon EC2 pour l'algorithme CatBoost

CatBoost SageMaker AI effectue actuellement l’entraînement uniquement à l’aide des processeurs. CatBoost est un algorithme dépendant de la mémoire (par opposition à un algorithme dépendant du calcul). Par conséquent, une instance de calcul à usage général (par exemple, M5) constitue un meilleur choix qu'une instance optimisée pour le calcul (par exemple, C5). De plus, nous vous recommandons d'avoir suffisamment de mémoire totale dans les instances sélectionnées pour contenir les données d'entraînement.

Exemples de blocs-notes CatBoost

Le tableau suivant présente divers exemples de blocs-notes traitant de différents cas d’utilisation de l’algorithme CatBoost dans Amazon SageMaker AI.

Titre du bloc-notes Description

Tabular classification with Amazon SageMaker AI LightGBM and CatBoost algorithm

Ce bloc-notes illustre l’utilisation de l’algorithme CatBoost dans Amazon SageMaker AI pour entraîner et héberger un modèle de classification tabulaire.

Tabular regression with Amazon SageMaker AI LightGBM and CatBoost algorithm

Ce bloc-notes illustre l’utilisation de l’algorithme CatBoost dans Amazon SageMaker AI pour entraîner et héberger un modèle de régression tabulaire.

Pour obtenir des instructions expliquant comment créer des instances de blocs-notes Jupyter et y accéder afin d’exécuter l’exemple dans SageMaker AI, consultez Instances de SageMaker blocs-notes Amazon. Après avoir créé et ouvert une instance de bloc-notes, cliquez sur l’onglet Exemples SageMaker AI pour afficher la liste de tous les exemples SageMaker AI. Pour ouvrir un bloc-notes, choisissez son onglet Use (Utiliser), puis Create copy (Créer une copie).