As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Hiperparâmetros de personalização de modelos Command da Cohere
Os modelos Command da Cohere e Command Light da Cohere são compatíveis com os os seguintes hiperparâmetros para a personalização de modelos: O número de épocas que você especifica aumenta o custo de personalização do modelo ao processar mais tokens. Cada época processa todo o conjunto de dados de treinamento uma vez. Para obter mais informações sobre preços, consulte Preços do Amazon Bedrock
Para obter informações sobre Cohere modelos de ajuste fino, consulte a Cohere documentação em ajuste https://docs.cohere.com/docs/fino
nota
A cota de epochCount
é ajustável.
Hiperparâmetro (console) | Hiperparâmetro (API) | Definição | Tipo | Mínimo | Máximo | Padrão |
---|---|---|---|---|---|---|
Epochs | epochCount | O número de iterações em todo o conjunto de dados de treinamento | integer | 1 | 100 | 1 |
Tamanho do lote | batchSize | O número de amostras processadas antes da atualização dos parâmetros do modelo | integer | 8 | 8 (Comando) 32 (Leve) |
8 |
Taxa de aprendizado | learningRate | A taxa em que os parâmetros do modelo são atualizados após cada lote. Se você usar um conjunto de dados de validação, é recomendável não fornecer um valor para learningRate . |
flutuação | 5.00E-6 | 0.1 | 1,00E-5 |
Tolerância para interrupção antecipada | earlyStoppingThreshold | A melhoria mínima na perda necessária para evitar o término prematuro do processo de treinamento | flutuação | 0 | 0.1 | 0,01 |
Tolerância para interrupção antecipada | earlyStoppingPatience | A tolerância à estagnação na métrica de perda antes de interromper o processo de treinamento | integer | 1 | 10 | 6 |
Percentual de avaliação | evalPercentage |
A porcentagem do conjunto de dados alocada para avaliação do modelo, caso você não forneça um conjunto de dados de validação separado. |
flutuação | 5 | 50 | 20 |