As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Hiperparâmetros do TabTransformer
A tabela a seguir contém o subconjunto de hiperparâmetros que são necessários ou mais comumente usados para o algoritmo TabTransformer do Amazon SageMaker AI. Os usuários definem esses parâmetros para facilitar a estimativa dos parâmetros do modelo a partir dos dados. O algoritmo TabTransformer do SageMaker AI é uma implementação do pacote TabTransformer
nota
Os hiperparâmetros padrão são baseados em conjuntos de dados de exemplo no Cadernos de amostra do TabTransformer.
Por padrão, o algoritmo TabTransformer do SageMaker AI escolhe automaticamente uma métrica de avaliação e uma função objetiva com base no tipo de problema de classificação. O algoritmo TabTransformer detecta o tipo de problema de classificação com base no número de rótulos em seus dados. Para problemas de regressão, a métrica de avaliação é o r quadrático e a função objetivo é o erro quadrático médio. Para problemas de classificação binária, a métrica de avaliação e a função objetiva são ambas entropia cruzada binária. Para problemas de classificação multiclasse, a métrica de avaliação e a função objetiva são ambas entropia cruzada multiclasse.
nota
A métrica de avaliação e as funções objetivas do TabTransformer não estão atualmente disponíveis como hiperparâmetros. Em vez disso, o algoritmo integrado TabTransformer do SageMaker AI detecta automaticamente o tipo de tarefa de classificação (regressão, binária ou multiclasse) com base na quantidade de números inteiros exclusivos na coluna do rótulo e atribui uma métrica de avaliação e uma função objetiva.
| Nome do parâmetro | Descrição |
|---|---|
n_epochs |
Número de épocas para treinar a rede neural profunda. Valores válidos: inteiro, intervalo: inteiro positivo. Valor padrão: |
patience |
O treinamento será interrompido se uma métrica de um ponto de dados de validação não melhorar na última rodada Valores válidos: inteiro, intervalo: ( Valor padrão: |
learning_rate |
A taxa na qual os pesos do modelo são atualizados depois de analisar cada lote de exemplos de treinamento. Valores válidos: flutuante, intervalo: número de ponto flutuante positivo. Valor padrão: |
batch_size |
O número de exemplos propagados pela rede. Valores válidos: flutuante, intervalo: ( Valor padrão: |
input_dim |
A dimensão das incorporações para codificar as colunas categóricas e/ou contínuas. Valores válidos: string, qualquer um dos seguintes: Valor padrão: |
n_blocks |
O número de blocos do codificador Transformer. Valores válidos: inteiro, intervalo: ( Valor padrão: |
attn_dropout |
Taxa de desistência aplicada às camadas Multi-Head Attention. Valores válidos: flutuante. Intervalo: ( Valor padrão: |
mlp_dropout |
Taxa de abandono aplicada à rede FeedForward dentro das camadas do codificador e às camadas MLP finais sobre os codificadores do Transformer. Valores válidos: flutuante. Intervalo: ( Valor padrão: |
frac_shared_embed |
A fração de incorporações compartilhadas por todas as diferentes categorias de uma coluna específica. Valores válidos: flutuante, intervalo: ( Valor padrão: |