Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Hiperparámetros de LDA
En la solicitud CreateTrainingJob, especifique el algoritmo de capacitación. También puede especificar hiperparámetros específicos del algoritmo como mapas. string-to-string En la siguiente tabla se enumeran los hiperparámetros del algoritmo de entrenamiento LDA proporcionado por Amazon SageMaker AI. Para obtener más información, consulte Funcionamiento de LDA.
| Nombre del parámetro | Descripción |
|---|---|
num_topics |
El número de temas de LDA para buscar en los datos. Obligatorio Valores válidos: número entero positivo |
feature_dim |
El tamaño del vocabulario del cuerpo de documentos de entrada. Obligatorio Valores válidos: número entero positivo |
mini_batch_size |
El número total de documentos en el cuerpo de documentos de entrada. Obligatorio Valores válidos: número entero positivo |
alpha0 |
Suposición inicial del parámetro de concentración: la suma de los elementos de Dirichlet anterior. Es más probable que los valores pequeños generen combinaciones de temas dispersos y los valores grandes (superiores a 1,0) generen combinaciones más uniformes. Opcional Valores válidos: número flotante positivo Valor predeterminado: 1.0 |
max_restarts |
El número de reinicios que realizar durante la fase de descomposición espectral de mínimos cuadrados alternantes (ALS) del algoritmo. Se puede utilizar para buscar mejor el mínimo local de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número entero positivo Valor predeterminado: 10 |
max_iterations |
El número máximo de iteraciones que realizar durante la fase ALS del algoritmo. Se puede utilizar para buscar mejor el mínimo de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número entero positivo Valor predeterminado: 1000 |
tol |
Tolerancia a errores del destino para la fase ALS del algoritmo. Se puede utilizar para buscar mejor el mínimo de calidad a costa de una computación adicional, pero normalmente no debe ajustarse. Opcional Valores válidos: número flotante positivo Valor predeterminado: 1e-8 |