Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Ajustez les Amazon Nova modèles grâce à un réglage précis supervisé
Amazon NovaLes données SFT 2.0 utilisent le même format d'API Converse que la Amazon Nova version 1.0, avec l'ajout de champs de contenu de raisonnement facultatifs. Pour les spécifications de format complètes, voir le schéma ReasoningContentBlockde l'API Converse.
Fonctionnalités prises en charge :
Types de saisie : texte, image ou vidéo dans les blocs de contenu utilisateur
Contenu de l'assistant — Réponses sous forme de texte uniquement et contenu de raisonnement
Composition du jeu de données — Doit être homogène. Choisissez l'une des options suivantes : virages textuels uniquement, tournages texte+image ou texte+vidéo
Important
Vous ne pouvez pas mélanger des images et des vidéos dans le même jeu de données ou sur différents tours.
Limitations actuelles :
Utilisation des outils — Bien que l'utilisation des outils soit prise en charge dans le format d'entrée, elle n'est actuellement pas prise en charge par Amazon Nova 2.0 SFT. L'ajout de sections d'outils peut entraîner l'échec de votre tâche.
Contenu de raisonnement multimodal — Bien que le format Converse prenne en charge le contenu de raisonnement basé sur des images, celui-ci n'est pas pris en charge par Amazon Nova 2.0 SFT.
Ensembles de validation — La fourniture d'un ensemble de validation peut être prise en charge via l'interface utilisateur mais ne le sera pas pendant la formation SFT.
Formats multimédia pris en charge :
Images — PNG, JPEG, GIF
Vidéos — MOV, MKV, MP4
Exemples de formats de données
Contenu du raisonnement
Le contenu du raisonnement (également appelé chain-of-thought) capture les étapes de réflexion intermédiaires du modèle avant de générer une réponse finale. À votre assistant tour, utilisez le reasoningContent champ pour inclure ces traces de raisonnement.
Comment est calculée la perte :
Avec un contenu de raisonnement — La perte d'entraînement inclut à la fois des jetons de raisonnement et des jetons de résultat final
Sans raisonnement, contenu : la perte d'entraînement est calculée uniquement sur les jetons de sortie finaux
Quand activer le mode raisonnement : définissez reasoning_enabled: true dans votre configuration d'entraînement le moment où vous souhaitez que le modèle génère des jetons de réflexion avant de produire les résultats finaux ou si vous avez besoin de meilleures performances sur des tâches de raisonnement complexes. Définissez le reasoning_enabled: false moment où vous vous entraînez sur des tâches simples qui ne nécessitent pas d'étapes de raisonnement explicites.
Note
Vous pouvez activer le mode raisonnement, que vos données d'entraînement contiennent ou non du contenu de raisonnement. Cependant, il est recommandé d'inclure des traces de raisonnement dans vos données d'entraînement afin que le modèle puisse tirer des leçons de ces exemples et améliorer la qualité du raisonnement.
Directives de mise en forme :
Utilisez du texte brut pour raisonner le contenu.
Évitez les balises de balisage telles que
<thinking>et</thinking>sauf si cela est spécifiquement requis par votre tâche.Assurez-vous que le contenu du raisonnement est clair et pertinent pour le processus de résolution des problèmes.
Le contenu du raisonnement efficace doit inclure :
Réflexions et analyses intermédiaires
Déductions logiques et étapes d'inférence
Step-by-step approches de résolution de problèmes
Liens explicites entre les étapes et les conclusions
Si votre jeu de données ne contient pas de traces de raisonnement, vous pouvez les créer à l'aide d'un modèle capable de raisonner tel que Nova Premier. Fournissez vos paires d'entrées-sorties au modèle et capturez son processus de raisonnement pour créer un ensemble de données augmenté par le raisonnement.
Directives pour la préparation des jeux
Le tableau suivant fournit des instructions pour préparer votre jeu de données d'entraînement.
| Ligne directrice | Description |
|---|---|
| Taille et qualité |
|
| Diversité |
Incluez divers exemples qui permettent d'effectuer les opérations suivantes :
|
| Formatage de sortie |
Spécifiez clairement le format de sortie souhaité dans les réponses de l'assistant. Les exemples incluent les structures JSON, les tableaux, le format CSV ou les formats personnalisés spécifiques à votre application. |
| Conversations complexes |
|
| Liste de contrôle de qualité |
|