Hiperparâmetros de personalização de modelos Command da Cohere - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Hiperparâmetros de personalização de modelos Command da Cohere

Os modelos Command da Cohere e Command Light da Cohere são compatíveis com os os seguintes hiperparâmetros para a personalização de modelos: O número de épocas que você especifica aumenta o custo de personalização do modelo ao processar mais tokens. Cada época processa todo o conjunto de dados de treinamento uma vez. Para obter mais informações sobre preços, consulte Preços do Amazon Bedrock. Para obter mais informações, consulte Personalizar o modelo para melhorar a performance para o caso de uso.

Para obter informações sobre Cohere modelos de ajuste fino, consulte a Cohere documentação em ajuste https://docs.cohere.com/docs/fino.

nota

A cota de epochCount é ajustável.

Hiperparâmetro (console) Hiperparâmetro (API) Definição Tipo Mínimo Máximo Padrão
Epochs epochCount O número de iterações em todo o conjunto de dados de treinamento integer 1 100 1
Tamanho do lote batchSize O número de amostras processadas antes da atualização dos parâmetros do modelo integer 8 8 (Comando)

32 (Leve)

8
Taxa de aprendizado learningRate A taxa em que os parâmetros do modelo são atualizados após cada lote. Se você usar um conjunto de dados de validação, é recomendável não fornecer um valor para learningRate. flutuação 5.00E-6 0.1 1,00E-5
Tolerância para interrupção antecipada earlyStoppingThreshold A melhoria mínima na perda necessária para evitar o término prematuro do processo de treinamento flutuação 0 0.1 0,01
Tolerância para interrupção antecipada earlyStoppingPatience A tolerância à estagnação na métrica de perda antes de interromper o processo de treinamento integer 1 10 6
Percentual de avaliação evalPercentage

A porcentagem do conjunto de dados alocada para avaliação do modelo, caso você não forneça um conjunto de dados de validação separado.

flutuação 5 50 20