Ajuste um modelo CatBoost - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Ajuste um modelo CatBoost

O ajuste automático de modelos, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados. O ajuste do modelo se concentra nos seguintes hiperparâmetros:

nota

A função de perda de aprendizado é atribuída automaticamente com base no tipo de tarefa de classificação, que é determinado pelo número de números inteiros exclusivos na coluna do rótulo. Para ter mais informações, consulte Hiperparâmetros do CatBoost.

  • uma função de aprendizado para otimizar durante o treinamento do modelo

  • Uma métrica de avaliação usada para avaliar o desempenho do modelo durante a validação

  • Um conjunto de hiperparâmetros e uma faixa de valores para cada um usar ao ajustar o modelo automaticamente

O ajuste de modelo automático pesquisa os seus hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica escolhida.

nota

O ajuste automático de modelos para o CatBoost está disponível somente nos SDKs do Amazon SageMaker, não no console do SageMaker AI.

Para mais informações sobre o ajuste de modelos, consulte Ajuste automático do modelo com SageMaker IA.

Métricas de avaliação calculadas pelo algoritmo CatBoost

O algoritmo CatBoost do SageMaker AI calcula as métricas a seguir para usar na validação do modelo. A métrica de avaliação é atribuída automaticamente com base no tipo de tarefa de classificação, que é determinado pelo número de números inteiros exclusivos na coluna do rótulo.

Nome da métrica Descrição Direção de otimização Padrão Regex
RMSE erro quadrático médio. minimizar "bestTest = ([0-9\\.]+)"
MAE erro absoluto médio minimizar "bestTest = ([0-9\\.]+)"
MedianAbsoluteError erro absoluto mediano minimizar "bestTest = ([0-9\\.]+)"
R2 pontuação r2 maximizar "bestTest = ([0-9\\.]+)"
Logloss entropia cruzada binária maximizar "bestTest = ([0-9\\.]+)"
Precision precisão maximizar "bestTest = ([0-9\\.]+)"
Recall recall maximizar "bestTest = ([0-9\\.]+)"
F1 pontuação de f1 maximizar "bestTest = ([0-9\\.]+)"
AUC pontuação de auc maximizar "bestTest = ([0-9\\.]+)"
MultiClass entropia cruzada multiclasse maximizar "bestTest = ([0-9\\.]+)"
Accuracy accuracy maximizar "bestTest = ([0-9\\.]+)"
BalancedAccuracy precisão balanceada maximizar "bestTest = ([0-9\\.]+)"

Hiperparâmetros ajustáveis de CatBoost

Ajuste o modelo CatBoost com os seguintes hiperparâmetros: Os hiperparâmetros que têm o maior efeito na otimização das métricas de avaliação do CatBoost são: learning_rate, depth, l2_leaf_reg e random_strength. Para obter uma lista de todos os hiperparâmetros do CatBoost, consulte Hiperparâmetros do CatBoost.

Nome do parâmetro Tipo de parâmetro Intervalos recomendados
learning_rate ContinuousParameterRanges MinValue: 0.001, MaxValue: 0.01
depth IntegerParameterRanges MinValue: 4, MaxValue: 10
l2_leaf_reg IntegerParameterRanges MinValue: 2, MaxValue:10
random_strength ContinuousParameterRanges MinValue: 0, MaxValue: 10