As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ajuste Amazon Nova modelos com ajuste fino supervisionado
Amazon NovaOs dados 2.0 SFT usam o mesmo formato de API Converse da Amazon Nova 1.0, com a adição de campos de conteúdo de raciocínio opcionais. Para obter as especificações completas do formato, consulte ReasoningContentBlocko esquema da API Converse.
Funcionalidades suportadas:
Tipos de entrada — texto, imagem ou vídeo em blocos de conteúdo do usuário
Conteúdo do Assistente — respostas somente em texto e conteúdo de raciocínio
Composição do conjunto de dados — deve ser homogênea. Escolha uma das seguintes opções: curvas somente de texto, curvas de texto+imagem ou curvas de texto+vídeo
Importante
Você não pode misturar imagens e vídeos no mesmo conjunto de dados ou em turnos diferentes.
Limitações atuais:
Uso da ferramenta — Embora o uso da ferramenta seja suportado no formato de entrada, atualmente não é suportado pelo Amazon Nova 2.0 SFT. Adicionar seções de ferramentas pode fazer com que seu trabalho falhe.
Conteúdo de raciocínio multimodal — Embora o formato Converse ofereça suporte a conteúdo de raciocínio baseado em imagem, isso não é suportado pelo 2.0 SFT. Amazon Nova
Conjuntos de validação — O fornecimento de um conjunto de validação pode ser suportado por meio da interface do usuário, mas não será suportado durante o treinamento do SFT.
Formatos de mídia compatíveis:
Imagens — PNG, JPEG, GIF
Vídeos — MOV, MKV, MP4
Exemplos de formato de dados
Conteúdo de raciocínio
O conteúdo de raciocínio (também chamado chain-of-thought) captura as etapas intermediárias do pensamento do modelo antes de gerar uma resposta final. assistantPor sua vez, use o reasoningContent campo para incluir esses traços de raciocínio.
Como a perda é calculada:
Com conteúdo de raciocínio — a perda de treinamento inclui tokens de raciocínio e tokens de saída final
Conteúdo sem raciocínio — a perda de treinamento é calculada apenas com base nos tokens de saída finais
Quando ativar o modo de raciocínio: defina reasoning_enabled: true em sua configuração de treinamento quando você deseja que o modelo gere tokens de raciocínio antes de produzir resultados finais ou precise de um desempenho aprimorado em tarefas complexas de raciocínio. Defina reasoning_enabled: false quando você está treinando em tarefas simples que não se beneficiam de etapas explícitas de raciocínio.
nota
Você pode ativar o modo de raciocínio independentemente de seus dados de treinamento conterem conteúdo de raciocínio. No entanto, é recomendável incluir traços de raciocínio em seus dados de treinamento para que o modelo possa aprender com esses exemplos e melhorar a qualidade do raciocínio.
Diretrizes de formatação:
Use texto simples para raciocinar o conteúdo.
Evite tags de marcação como
<thinking>e,</thinking>a menos que sejam especificamente exigidas por sua tarefa.Garanta que o conteúdo do raciocínio seja claro e relevante para o processo de solução de problemas.
O conteúdo de raciocínio eficaz deve incluir:
Pensamentos e análises intermediários
Deduções lógicas e etapas de inferência
Step-by-step abordagens de resolução de problemas
Conexões explícitas entre etapas e conclusões
Se seu conjunto de dados não tiver traços de raciocínio, você poderá criá-los usando um modelo capaz de raciocinar, como o Nova Premier. Forneça seus pares de entrada e saída ao modelo e capture seu processo de raciocínio para criar um conjunto de dados com raciocínio aumentado.
Diretrizes de preparação de conjuntos de dados
A tabela a seguir fornece diretrizes para preparar seu conjunto de dados de treinamento.
| Diretriz | Description |
|---|---|
| Tamanho e qualidade |
|
| Diversidade |
Inclua diversos exemplos que façam o seguinte:
|
| Formatação de saída |
Especifique claramente o formato de saída desejado nas respostas do assistente. Os exemplos incluem estruturas JSON, tabelas, formato CSV ou formatos personalizados específicos para seu aplicativo. |
| Conversas em vários turnos |
|
| Lista de verificação de qualidade |
|