Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Hiperparámetros de TabTransformer
La siguiente tabla contiene el subconjunto de hiperparámetros necesarios, o empleados con frecuencia, en el algoritmo TabTransformer de Amazon SageMaker AI. Los usuarios establecen estos parámetros para facilitar la estimación de los parámetros del modelo a partir de los datos. El algoritmo TabTransformer de SageMaker AI es una implementación del paquete TabTransformer
nota
Los hiperparámetros predeterminados se basan en conjuntos de datos de ejemplo de Cuadernos de muestra de TabTransformer.
El algoritmo TabTransformer de SageMaker AI elige automáticamente una métrica de evaluación y una función objetivo según el tipo de problema de clasificación. El algoritmo TabTransformer detecta el tipo de problema de clasificación a partir del número de etiquetas en los datos. Para los problemas de regresión, la métrica de evaluación es R² y la función objetivo es el error cuadrático medio. Para los problemas de clasificación binaria, la métrica de evaluación y la función objetivo son la entropía cruzada binaria. Para los problemas de clasificación multiclase, la métrica de evaluación y la función objetivo son la entropía cruzada multiclase.
nota
Las funciones de métrica y objetivo de evaluación de TabTransformer no están disponibles actualmente como hiperparámetros. En lugar de esto, el algoritmo integrado TabTransformer de SageMaker AI detecta automáticamente el tipo de tarea de clasificación (regresión, binaria o multiclase) en función del número de enteros únicos en la columna de etiqueta, y asigna una métrica de evaluación y una función objetivo.
| Nombre del parámetro | Descripción |
|---|---|
n_epochs |
Número de epochs (fechas de inicio) para entrenar la red neuronal profunda. Valores válidos: entero positivo. Valor predeterminado: |
patience |
El entrenamiento se detendrá si una métrica de un punto de datos de validación no mejora en la última ronda Valores válidos: entero, rango ( Valor predeterminado: |
learning_rate |
La velocidad a la que se actualizan los pesos del modelo después de pasar por cada lote de ejemplos de entrenamiento. Valores válidos: flotante, rango (número de coma flotante positivo). Valor predeterminado: |
batch_size |
El número de ejemplos propagados a través de la red. Valores válidos: entero, rango ( Valor predeterminado: |
input_dim |
La dimensión de las incrustaciones para codificar las columnas categóricas o continuas. Valores válidos: cadena, cualquiera de los siguientes ( Valor predeterminado: |
n_blocks |
El número de bloques codificadores Transformer. Valores válidos: entero, rango ( Valor predeterminado: |
attn_dropout |
Tasa de eliminación aplicada a las capas de atención Multi-Head. Valores válidos: flotante, rango ( Valor predeterminado: |
mlp_dropout |
La tasa de eliminación se aplica a la red FeedForward, dentro de las capas del codificador, y a las capas MLP finales, situadas en la parte superior de los codificadores Transformer. Valores válidos: flotante, rango ( Valor predeterminado: |
frac_shared_embed |
La fracción de incrustaciones que comparten todas las diferentes categorías de una columna en particular. Valores válidos: flotante, rango ( Valor predeterminado: |