Ottimizzare un modello CatBoost - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Ottimizzare un modello CatBoost

L'ottimizzazione automatica dei modelli, nota anche come ottimizzazione degli iperparametri, trova la versione migliore di un modello eseguendo molti processi che testano un intervallo di iperparametri sul set di dati di addestramento e di convalida. L'ottimizzazione del modello si concentra sui seguenti iperparametri:

Nota

La funzione di perdita di apprendimento viene assegnata automaticamente in base al tipo di attività di classificazione, che è determinata dal numero di numeri interi univoci nella colonna dell'etichetta. Per ulteriori informazioni, consulta Iperparametri CatBoost.

  • Una funzione di perdita di apprendimento da ottimizzare durante l’addestramento dei modelli

  • Un parametro di valutazione utilizzato per valutare le prestazioni del modello durante la convalida

  • Un insieme di iperparametri e un intervallo di valori per ciascuno da utilizzare quando si ottimizza automaticamente il modello

L'ottimizzazione automatica del modello ricerca gli iperparametri scelti per trovare la combinazione di valori che restituisce il modello che ottimizza il parametro di valutazione scelto.

Nota

L’ottimizzazione automatica del modello per CatBoost è disponibile solo tramite gli SDK di Amazon SageMaker, non tramite la console di Amazon SageMaker AI.

Per ulteriori informazioni sull'ottimizzazione del modello, consulta Ottimizzazione automatica dei modelli con AI SageMaker.

Parametri di valutazione calcolati dall'algoritmo CatBoost

L’algoritmo SageMaker AI CatBoost calcola le seguenti metriche da utilizzare per la convalida del modello. Il parametro di valutazione viene assegnato automaticamente in base al tipo di attività di classificazione, che è determinata dal numero di numeri interi univoci nella colonna dell'etichetta.

Nome parametro Descrizione Direzione dell'ottimizzazione Modello regex
RMSE radice dell'errore quadratico medio minimizza "bestTest = ([0-9\\.]+)"
MAE media degli errori assoluti minimizza "bestTest = ([0-9\\.]+)"
MedianAbsoluteError media degli errori assoluti minimizza "bestTest = ([0-9\\.]+)"
R2 punteggio r2 massimizza "bestTest = ([0-9\\.]+)"
Logloss entropia binaria incrociata massimizza "bestTest = ([0-9\\.]+)"
Precision precision massimizza "bestTest = ([0-9\\.]+)"
Recall recupero massimizza "bestTest = ([0-9\\.]+)"
F1 punteggio f1 massimizza "bestTest = ([0-9\\.]+)"
AUC punteggio auc massimizza "bestTest = ([0-9\\.]+)"
MultiClass entropia incrociata multiclasse massimizza "bestTest = ([0-9\\.]+)"
Accuracy accuratezza massimizza "bestTest = ([0-9\\.]+)"
BalancedAccuracy precisione bilanciata massimizza "bestTest = ([0-9\\.]+)"

Iperparametri CatBoost ottimizzabili

Ottimizza il modello CatBoost con i seguenti iperparametri. Gli iperparametri che hanno il maggiore impatto sull'ottimizzazione dei parametri di valutazione di CatBoost sono: learning_rate, depth, l2_leaf_reg e random_strength. Per un elenco di tutti gli iperparametri CatBoost, consulta Iperparametri CatBoost.

Nome parametro Tipo parametro Intervalli consigliati
learning_rate ContinuousParameterRanges MinValue: 0,001, MaxValue: 0,01
depth IntegerParameterRanges MinValue: 4, MaxValue: 10
l2_leaf_reg IntegerParameterRanges MinValue: 2, MaxValue: 10
random_strength ContinuousParameterRanges MinValue: 0, MaxValue: 10