CatBoost - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

CatBoost

CatBoost 是漸變增強決策樹 (GBDT) 算法的一種流行且高性能的開放原始碼實作。GBDT 是一種監督式學習演算法,藉由結合一組較簡單且較脆弱的模型之預估值集合來嘗試準確地預測目標變數。

CatBoost 為 GBDT 引入了兩個關鍵演算法進展:

  1. 有序增強的實作,這是經典演算法的排列驅動替代方案

  2. 一種用於處理分類特徵的創新算法

這兩種技術都是為了對抗由於目前所有現有的梯度增強演算法實現中存在的一種特殊目標洩漏引起的預測偏移。此頁面包含 Amazon EC2 執行個體推薦服務和 CatBoost 範例筆記本的相關資訊。

CatBoost 演算法的 Amazon EC2 執行個體推薦服務

SageMaker AI CatBoost 目前僅使用 CPU 進行訓練。CatBoost 是一個記憶體限制型 (相對於運算限制型) 的演算法。因此,一般用途的運算執行個體 (如 M5) 相較於運算最佳化執行個體 (如 C5),是較好的選擇。此外,我們建議您在所選執行個體中需有足夠的總記憶體才可保留訓練資料。

CatBoost 範例筆記本

下表概述了解決 Amazon SageMaker AI CatBoost - 自列表格演算法不同使用案例的各種範例筆記本。

筆記本標題 Description

使用 Amazon SageMaker AI LightGBM 和 CatBoost 演算法進行表格分類

本筆記本示範如何使用 Amazon SageMaker AI CatBoost 演算法來訓練和託管表格分類模型。

使用 Amazon SageMaker AI LightGBM 和 CatBoost 演算法進行表格迴歸

本筆記本示範如何使用 Amazon SageMaker AI CatBoost 演算法來訓練和託管表格迴歸模型。

有關如何建立和存取可用於在 SageMaker AI 中執行範例的 Jupyter 筆記本執行個體的說明,請參閱Amazon SageMaker 筆記本執行個體。建立並開啟筆記本執行個體後,請選擇 SageMaker AI 範例索引標籤,查看所有 SageMaker AI 範例清單。若要開啟筆記本,請選擇其使用標籤,然後選擇建立複本