Noções básicas sobre hiperparâmetros de personalização de modelos do Amazon Nova - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Noções básicas sobre hiperparâmetros de personalização de modelos do Amazon Nova

Os modelos Amazon Nova Lite, Amazon Nova Micro e Amazon Nova Pro permitem os hiperparâmetros a seguir para a personalização de modelos. Para obter mais informações, consulte Personalizar o modelo para melhorar a performance para o caso de uso.

Para ter informações sobre o ajuste fino dos modelos do Amazon Nova, consulte Ajuste dos modelos do Amazon Nova.

O número de épocas que você especifica aumenta o custo de personalização do modelo ao processar mais tokens. Cada época processa todo o conjunto de dados de treinamento uma vez. Para obter mais informações sobre preços, consulte Preços do Amazon Bedrock.

Hiperparâmetro (console) Hiperparâmetro (API) Definição Tipo Mínimo Máximo Padrão
Epochs epochCount O número de iterações em todo o conjunto de dados de treinamento integer 1 5 2
Taxa de aprendizado learningRate A taxa em que os parâmetros do modelo são atualizados após cada lote flutuação 1,00E-6 1.00E-4 1,00E-5
Etapas de aquecimento da taxa de aprendizado learningRateWarmupEtapas O número de iterações necessárias para que a taxa de aprendizado seja aumentada gradualmente na taxa especificada integer 0 100 10

O número padrão de épocas é 2, o que funciona na maioria dos casos. Em geral, conjuntos de dados maiores exigem menos épocas para convergir, enquanto conjuntos de dados menores exigem mais épocas para convergir. Uma convergência mais rápida também pode ser alcançada aumentando a taxa de aprendizado, mas isso é menos desejável porque pode levar à instabilidade do treinamento na convergência. Recomendamos começar com os hiperparâmetros padrão, que são baseados em nossa avaliação em tarefas de diferentes complexidades e tamanhos de dados.

A taxa de aprendizado aumentará gradualmente até o valor definido durante o aquecimento. Portanto, recomendamos evitar um valor grande de aquecimento quando a amostra de treinamento é pequena, porque a taxa de aprendizado pode nunca atingir o valor definido durante o processo de treinamento. Recomendamos definir as etapas de aquecimento dividindo o tamanho do conjunto de dados por 640 para o Amazon Nova Micro, 160 para o Amazon Nova Lite e 320 para o Amazon Nova Pro.