Hiperparámetros de la personalización del modelo Cohere Command - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Hiperparámetros de la personalización del modelo Cohere Command

Los modelos Cohere Command y Cohere Command Light admiten los siguientes hiperparámetros para la personalización del modelo. El número de épocas que especifique aumenta el coste de personalización del modelo al procesar más fichas. Cada época procesa todo el conjunto de datos de entrenamiento una vez. Para obtener más información acerca de los precios, consulte Precios de Amazon Bedrock. Para obtener más información, consulte Personalización del modelo para mejorar su rendimiento según su caso de uso.

Para obtener información sobre el ajuste fino de Cohere los modelos, consulte la Cohere documentación en el enlace https://docs.cohere.com/docs/fine-tuning.

nota

La cuota de epochCount se puede ajustar.

Hiperparámetro (consola) Hiperparámetro (API) Definición Tipo Mínimo Máximo Predeterminado/a
Épocas epochCount El número de iteraciones en todo el conjunto de datos de entrenamiento entero 1 100 1
Tamaño de lote batchSize El número de muestras procesadas antes de actualizar los parámetros del modelo entero 8 8 (Command)

32 (Light)

8
Tasa de aprendizaje learningRate Es la velocidad a la que se actualizan los parámetros del modelo después de cada lote. Si utiliza un conjunto de datos de validación, le recomendamos que no proporcione un valor para learningRate. float 5.00E-6 0.1 1,00E-5
Umbral de finalización anticipada earlyStoppingThreshold Mejora mínima de la pérdida de validación necesaria para evitar la finalización anticipada del proceso de aprendizaje float 0 0.1 0.01
Paciencia para finalización anticipada earlyStoppingPatience Tolerancia al estancamiento en la métrica de pérdida antes de detener el proceso de aprendizaje entero 1 10 6
Porcentaje de evaluación evalPercentage

El porcentaje del conjunto de datos asignado a la evaluación del modelo, si no proporciona un conjunto de datos de validación independiente.

float 5 50 20