As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ajuste fino supervisionado na versão 2.0 Amazon Nova
Visão geral do
Amazon NovaOs dados 2.0 SFT usam o mesmo formato de API Converse da Amazon Nova 1.0, com a adição de campos de conteúdo de raciocínio opcionais. Para obter as especificações completas do formato, consulte ReasoningContentBlocko esquema da API Converse.
Recursos compatíveis
Tipos de entrada — texto, imagem ou vídeo em blocos de conteúdo do usuário
Conteúdo do Assistente — respostas somente em texto e conteúdo de raciocínio
Composição do conjunto de dados — deve ser homogênea. Escolha uma das seguintes opções: curvas somente de texto, curvas de texto+imagem ou curvas de texto+vídeo
Importante
Você não pode misturar imagens e vídeos no mesmo conjunto de dados ou em turnos diferentes.
Limitações atuais
Uso da ferramenta — Embora o uso da ferramenta seja suportado no formato de entrada, atualmente não é suportado pelo Amazon Nova 2.0 SFT. Adicionar seções de ferramentas pode fazer com que seu trabalho falhe.
Conteúdo de raciocínio multimodal — Embora o formato Converse ofereça suporte a conteúdo de raciocínio baseado em imagem, isso não é suportado pelo 2.0 SFT. Amazon Nova
Conjuntos de validação — O fornecimento de um conjunto de validação pode ser suportado por meio da interface do usuário, mas não será suportado durante o treinamento do SFT.
Formatos de mídia compatíveis
Imagens — PNG, JPEG, GIF
Vídeos — MOV, MKV, MP4
Exemplos de formato de dados
Modos de raciocínio e não raciocínio
Entendendo o conteúdo do raciocínio: o conteúdo de raciocínio (também chamado chain-of-thought) captura as etapas intermediárias do pensamento do modelo antes de gerar uma resposta final. assistantPor sua vez, use o reasoningContent campo para incluir esses traços de raciocínio.
Como a perda é calculada:
Com conteúdo de raciocínio — a perda de treinamento inclui tokens de raciocínio e tokens de saída final
Conteúdo sem raciocínio — a perda de treinamento é calculada apenas com base nos tokens de saída finais
Você pode incluir reasoningContent vários turnos de assistente em conversas de vários turnos.
Quando ativar o modo de raciocínio
reasoning_enabled: trueDefina sua configuração de treinamento quando quiser que o modelo gere tokens de pensamento antes de produzir os resultados finais ou precisar de um desempenho aprimorado em tarefas complexas de raciocínio.
nota
Você pode ativar o modo de raciocínio independentemente de seus dados de treinamento conterem conteúdo de raciocínio. No entanto, é recomendável incluir traços de raciocínio em seus dados de treinamento para que o modelo possa aprender com esses exemplos e melhorar a qualidade do raciocínio.
Defina reasoning_enabled: false quando você está treinando em tarefas simples que não se beneficiam de etapas explícitas de raciocínio ou que desejam otimizar a velocidade e reduzir o uso de tokens.
Diretrizes de formatação
Use texto simples para raciocinar o conteúdo.
Evite tags de marcação como
<thinking>e,</thinking>a menos que sejam especificamente exigidas por sua tarefa.Garanta que o conteúdo do raciocínio seja claro e relevante para o processo de solução de problemas.
Gerando dados de raciocínio
Se seu conjunto de dados não tiver traços de raciocínio, você poderá criá-los usando um modelo capaz de raciocínio, como o. Forneça seus pares de entrada e saída ao modelo e capture seu processo de raciocínio para criar um conjunto de dados com raciocínio aumentado.
Usando tokens de raciocínio para treinamento
Ao treinar com o modo de raciocínio ativado, o modelo aprende a separar o raciocínio interno da resposta final. O processo de treinamento faz o seguinte:
Organiza os dados como triplos: entrada, raciocínio e resposta
Otimiza usando a perda de previsão padrão do próximo token tanto dos tokens de raciocínio quanto dos tokens de resposta
Incentiva o modelo a raciocinar internamente antes de gerar respostas
Conteúdo de raciocínio eficaz
O conteúdo de raciocínio de alta qualidade deve incluir o seguinte:
Pensamentos e análises intermediários
Deduções lógicas e etapas de inferência
Step-by-step abordagens de resolução de problemas
Conexões explícitas entre etapas e conclusões
Isso ajuda o modelo a desenvolver a capacidade de pensar antes de responder.
Diretrizes de preparação de conjuntos de dados
A tabela a seguir fornece diretrizes para preparar seu conjunto de dados de treinamento.
| Diretriz | Description |
|---|---|
| Tamanho e qualidade |
|
| Diversidade |
Inclua diversos exemplos que façam o seguinte:
|
| Formatação de saída |
Especifique claramente o formato de saída desejado nas respostas do assistente. Os exemplos incluem estruturas JSON, tabelas, formato CSV ou formatos personalizados específicos para seu aplicativo. |
| Conversas em vários turnos |
|
| Lista de verificação de qualidade |
|