CatBoost - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CatBoost

CatBoost es una implementación de código abierto popular y de alto rendimiento del algoritmo Gradient Boosting Decision Tree (GBDT). GBDT es un algoritmo de aprendizaje supervisado que intenta predecir adecuadamente una variable objetivo mediante la combinación de un conjunto de estimaciones a partir de un conjunto de modelos más simples y más débiles.

CatBoost introduce dos avances algorítmicos fundamentales en el GBDT:

  1. La implementación de la potenciación ordenada, una alternativa al algoritmo clásico basada en permutaciones

  2. Un algoritmo innovador para procesar características categóricas

Ambas técnicas se crearon para combatir un cambio de predicción provocado por un tipo especial de fuga de objetivo presente en todas las implementaciones actuales de algoritmos de potenciación por gradiente. Esta página incluye información sobre las recomendaciones de instancias de Amazon EC2 y cuadernos de muestra para CatBoost.

Recomendación de instancias de Amazon EC2 para el algoritmo CatBoost

Actualmente, SageMaker AI CatBoost solo realiza el entrenamiento mediante CPU. CatBoost es un algoritmo de vinculación de memoria (distinto a la vinculación de computación). Por lo tanto, una instancia de computación de uso general (por ejemplo, M5) es una opción mejor que una instancia optimizada para la computación (por ejemplo, C5). Además, recomendamos que disponga de suficiente memoria en total en las instancias seleccionadas para almacenar los datos de capacitación.

Cuadernos de muestra de CatBoost

En la siguiente tabla, encontrará algunos cuadernos de muestra con distintos casos de uso del algoritmo CatBoost de Amazon SageMaker AI.

Título del cuaderno Descripción

Tabular classification with Amazon SageMaker AI LightGBM and CatBoost algorithm

Este cuaderno muestra el uso del algoritmo CatBoost de Amazon SageMaker AI para entrenar y alojar un modelo de clasificación tabular.

Tabular regression with Amazon SageMaker AI LightGBM and CatBoost algorithm

Este cuaderno muestra el uso del algoritmo CatBoost de Amazon SageMaker AI para entrenar y alojar un modelo de regresión tabular.

Para obtener instrucciones sobre cómo crear instancias de cuadernos de Jupyter que pueda utilizar para ejecutar el ejemplo en SageMaker AI (y sobre cómo acceder a estas instancias), consulte Instancias de Amazon SageMaker Notebook. Después de crear y abrir una instancia de cuaderno, seleccione la pestaña Ejemplos de SageMaker AI para ver una lista de todas las muestras de SageMaker AI. Para abrir un cuaderno, elija su pestaña Usar y elija Crear copia.