

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# CatBoost hiperparâmetros
<a name="catboost-hyperparameters"></a>

A tabela a seguir contém o subconjunto de hiperparâmetros que são necessários ou mais comumente usados para o algoritmo Amazon SageMaker AI CatBoost . Os usuários definem esses parâmetros para facilitar a estimativa dos parâmetros do modelo a partir dos dados. O CatBoost algoritmo de SageMaker IA é uma implementação do [CatBoost](https://github.com/catboost/catboost)pacote de código aberto.

**nota**  
Os hiperparâmetros padrão são baseados em conjuntos de dados de exemplo no [CatBoost cadernos de amostra](catboost.md#catboost-sample-notebooks).

Por padrão, o CatBoost algoritmo de SageMaker IA escolhe automaticamente uma métrica de avaliação e uma função de perda com base no tipo de problema de classificação. O CatBoost algoritmo detecta o tipo de problema de classificação com base no número de rótulos em seus dados. Para problemas de regressão, a métrica de avaliação e as funções de perda são, ambas, a raiz do erro quadrático médio. Para problemas de classificação binária, a métrica de avaliação é Área sob a curva (AUC) e a função de perda é perda de log. Para problemas de classificação multiclasse, a métrica de avaliação e as funções de perda são entropia cruzada multiclasse. Você pode usar o hiperparâmetro `eval_metric` para alterar a métrica de avaliação padrão. Consulte a tabela a seguir para obter mais informações sobre os hiperparâmetros do LightGBM, incluindo descrições, valores válidos e valores padrão.


| Nome do parâmetro | Description | 
| --- | --- | 
| iterations |  O número máximo de árvores que podem ser construídas. Valores válidos: inteiro, intervalo: inteiro positivo. Valor padrão: `500`.  | 
| early\$1stopping\$1rounds |  O treinamento será interrompido se uma métrica de um ponto de dados de validação não melhorar na última rodada `early_stopping_rounds`. Se `early_stopping_rounds` for menor ou igual a zero, esse hiperparâmetro será ignorado. Valores válidos: inteiro. Valor padrão: `5`.  | 
| eval\$1metric |  A métrica de avaliação para os dados de validação. Se `eval_metric` for definido como o valor padrão `"auto"`, o algoritmo escolherá automaticamente uma métrica de avaliação com base no tipo de problema de classificação: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/catboost-hyperparameters.html) Valores válidos: string, consulte a [CatBoost documentação](https://catboost.ai/en/docs/references/eval-metric__supported-metrics) para valores válidos. Valor padrão: `"auto"`.  | 
| learning\$1rate |  A taxa na qual os pesos do modelo são atualizados depois de analisar cada lote de exemplos de treinamento. Valores válidos: flutuante. Intervalo: (`0.0`, `1.0`). Valor padrão: `0.009`.  | 
| depth |  Profundidade da árvore. Valores válidos: inteiro. Intervalo: (`1`, `16`). Valor padrão: `6`.  | 
| l2\$1leaf\$1reg |  Coeficiente para o termo de regularização L2 da função de custo. Valores válidos: inteiro, intervalo: inteiro positivo. Valor padrão: `3`.  | 
| random\$1strength |  A quantidade de aleatoriedade a ser usada para dividir a pontuação quando a estrutura da árvore é selecionada. Use esse parâmetro para evitar o ajuste excessivo do modelo. Valores válidos: flutuante, intervalo: número de ponto flutuante positivo. Valor padrão: `1.0`.  | 
| max\$1leaves |  O número máximo de folhas na árvore resultante. Só pode ser usado com a política de crescimento `"Lossguide"`. Valores válidos: inteiro, Intervalo: [`2`, `64`]. Valor padrão: `31`.  | 
| rsm |  Método de subespaço aleatório. A porcentagem de atributos a serem usados em cada seleção dividida, quando os atributos são selecionados aleatoriamente outra vez. Valores válidos: flutuante. Intervalo: (`0.0`, `1.0`]. Valor padrão: `1.0`.  | 
| sampling\$1frequency |  Frequência para amostrar pesos e objetos ao construir árvores. Valores válidos: string, ou: (`"PerTreeLevel"` ou `"PerTree"`). Valor padrão: `"PerTreeLevel"`.  | 
| min\$1data\$1in\$1leaf |  O número mínimo de amostras de treinamento em uma folha. CatBoost não procura novas divisões em folhas com uma contagem de amostras menor que o valor especificado. Só pode ser usado com as políticas de crescimento `"Lossguide"` e `"Depthwise"`. Valores válidos: inteiro, Intervalo: (`1` ou `∞`). Valor padrão: `1`.  | 
| bagging\$1temperature |  Define as configurações do bootstrap bayesiano. Use o bootstrap bayesiano para atribuir pesos aleatórios aos objetos. Se `bagging_temperature` estiver definido como `1.0`, os pesos serão amostrados a partir de uma distribuição exponencial. Se `bagging_temperature` estiver definido como `0.0`, todos os pesos serão 1,0. Valores válidos: flutuante, intervalo: flutuante não negativo. Valor padrão: `1.0`.  | 
| boosting\$1type |  O esquema de reforço. “Auto” significa que `boosting_type` é selecionado com base no tipo de unidade de processamento, no número de objetos no conjunto de dados de treinamento e no modo de aprendizado selecionado. Valores válidos: string, qualquer um dos seguintes: (`"Auto"`, `"Ordered"`, `"Plain"`). Valor padrão: `"Auto"`.  | 
| scale\$1pos\$1weight |  O peso da classe positiva na classificação binária. O valor é usado como um multiplicador para os pesos dos objetos da classe positiva. Valores válidos: flutuante, intervalo: flutuante positivo. Valor padrão: `1.0`.  | 
| max\$1bin |  O número de divisões para atributos numéricos. `"Auto"`significa que `max_bin` é selecionado com base no tipo de unidade de processamento e em outros parâmetros. Para obter detalhes, consulte a CatBoost documentação. Valores válidos: string, either: (`"Auto"` ou string de inteiro de `"1"` até `"65535"` inclusivamente). Valor padrão: `"Auto"`.  | 
| grow\$1policy |  A política de crescimento de árvores. Define como realizar a construção de árvores gananciosas. Valores válidos: string, qualquer um dos seguintes: (`"SymmetricTree"`, `"Depthwise"` ou `"Lossguide"`). Valor padrão: `"SymmetricTree"`.  | 
| random\$1seed |  A semente aleatória usada para treinamento. Valores válidos: inteiro, intervalo: inteiro não negativo. Valor padrão: `1.0`. | 
| thread\$1count |  O número de threads a serem usados durante o treinamento. Se `thread_count` for`-1`, então o número de threads é igual ao número de núcleos do processador. `thread_count` não pode ser`0`. Valores válidos: número inteiro: (ou número inteiro positivo)`-1`. Valor padrão: `-1`.  | 
| verbose |  A verbosidade das mensagens impressas, com níveis mais altos correspondendo a declarações impressas mais detalhadas. Valores válidos: inteiro, intervalo: inteiro positivo. Valor padrão: `1`.  | 