Ajustez les Amazon Nova modèles grâce à un réglage précis supervisé - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ajustez les Amazon Nova modèles grâce à un réglage précis supervisé

Amazon NovaLes données SFT 2.0 utilisent le même format d'API Converse que la Amazon Nova version 1.0, avec l'ajout de champs de contenu de raisonnement facultatifs. Pour les spécifications de format complètes, voir le schéma ReasoningContentBlockde l'API Converse.

Fonctionnalités prises en charge :

  • Types de saisie : texte, image ou vidéo dans les blocs de contenu utilisateur

  • Contenu de l'assistant — Réponses sous forme de texte uniquement et contenu de raisonnement

  • Composition du jeu de données — Doit être homogène. Choisissez l'une des options suivantes : virages textuels uniquement, tournages texte+image ou texte+vidéo

Important

Vous ne pouvez pas mélanger des images et des vidéos dans le même jeu de données ou sur différents tours.

Limitations actuelles :

  • Utilisation des outils — Bien que l'utilisation des outils soit prise en charge dans le format d'entrée, elle n'est actuellement pas prise en charge par Amazon Nova 2.0 SFT. L'ajout de sections d'outils peut entraîner l'échec de votre tâche.

  • Contenu de raisonnement multimodal — Bien que le format Converse prenne en charge le contenu de raisonnement basé sur des images, celui-ci n'est pas pris en charge par Amazon Nova 2.0 SFT.

  • Ensembles de validation — La fourniture d'un ensemble de validation peut être prise en charge via l'interface utilisateur mais ne le sera pas pendant la formation SFT.

Formats multimédia pris en charge :

  • Images — PNG, JPEG, GIF

  • Vidéos — MOV, MKV, MP4

Exemples de formats de données

Text-only

Cet exemple montre un format texte de base compatible avec Amazon Nova la version 1.0.

{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a digital assistant with a friendly personality" } ], "messages": [ { "role": "user", "content": [ { "text": "What country is right next to Australia?" } ] }, { "role": "assistant", "content": [ { "text": "The closest country is New Zealand" } ] } ] }
Text with reasoning

Cet exemple montre du texte avec un contenu de raisonnement facultatif pour la Amazon Nova version 2.0.

{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a digital assistant with a friendly personality" } ], "messages": [ { "role": "user", "content": [ { "text": "What country is right next to Australia?" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "I need to use my world knowledge of geography to answer this question" } } }, { "text": "The closest country to Australia is New Zealand, located to the southeast across the Tasman Sea." } ] } ] }
Note

Actuellement, seul reasoningText est pris en charge au sein dereasoningContent. Le contenu du raisonnement multimodal n'est pas encore disponible.

Image + text

Cet exemple montre comment inclure une entrée d'image dans du texte.

{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a helpful assistant." } ], "messages": [ { "role": "user", "content": [ { "image": { "format": "jpeg", "source": { "s3Location": { "uri": "s3://your-bucket/your-path/your-image.jpg", "bucketOwner": "your-aws-account-id" } } } }, { "text": "Which country is highlighted in the image?" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "I will determine the highlighted country by examining its location on the map and using my geographical knowledge" } } }, { "text": "The highlighted country is New Zealand" } ] } ] }
Video + text

Cet exemple montre comment inclure une entrée vidéo dans du texte.

{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a helpful assistant." } ], "messages": [ { "role": "user", "content": [ { "video": { "format": "mp4", "source": { "s3Location": { "uri": "s3://your-bucket/your-path/your-video.mp4", "bucketOwner": "your-aws-account-id" } } } }, { "text": "What is shown in this video?" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "I will analyze the video content to identify key elements" } } }, { "text": "The video shows a map with New Zealand highlighted" } ] } ] }

Contenu du raisonnement

Le contenu du raisonnement (également appelé chain-of-thought) capture les étapes de réflexion intermédiaires du modèle avant de générer une réponse finale. À votre assistant tour, utilisez le reasoningContent champ pour inclure ces traces de raisonnement.

Comment est calculée la perte :

  • Avec un contenu de raisonnement — La perte d'entraînement inclut à la fois des jetons de raisonnement et des jetons de résultat final

  • Sans raisonnement, contenu : la perte d'entraînement est calculée uniquement sur les jetons de sortie finaux

Quand activer le mode raisonnement : définissez reasoning_enabled: true dans votre configuration d'entraînement le moment où vous souhaitez que le modèle génère des jetons de réflexion avant de produire les résultats finaux ou si vous avez besoin de meilleures performances sur des tâches de raisonnement complexes. Définissez le reasoning_enabled: false moment où vous vous entraînez sur des tâches simples qui ne nécessitent pas d'étapes de raisonnement explicites.

Note

Vous pouvez activer le mode raisonnement, que vos données d'entraînement contiennent ou non du contenu de raisonnement. Cependant, il est recommandé d'inclure des traces de raisonnement dans vos données d'entraînement afin que le modèle puisse tirer des leçons de ces exemples et améliorer la qualité du raisonnement.

Directives de mise en forme :

  • Utilisez du texte brut pour raisonner le contenu.

  • Évitez les balises de balisage telles que <thinking> et </thinking> sauf si cela est spécifiquement requis par votre tâche.

  • Assurez-vous que le contenu du raisonnement est clair et pertinent pour le processus de résolution des problèmes.

Le contenu du raisonnement efficace doit inclure :

  • Réflexions et analyses intermédiaires

  • Déductions logiques et étapes d'inférence

  • Step-by-step approches de résolution de problèmes

  • Liens explicites entre les étapes et les conclusions

Si votre jeu de données ne contient pas de traces de raisonnement, vous pouvez les créer à l'aide d'un modèle capable de raisonner tel que Nova Premier. Fournissez vos paires d'entrées-sorties au modèle et capturez son processus de raisonnement pour créer un ensemble de données augmenté par le raisonnement.

Directives pour la préparation des jeux

Le tableau suivant fournit des instructions pour préparer votre jeu de données d'entraînement.

Directives pour la préparation des jeux
Ligne directrice Description
Taille et qualité
  • Taille recommandée : 2 000 à 10 000 échantillons

  • Échantillons minimum : 200

  • Privilégiez la qualité à la quantité. Assurez-vous que les exemples sont exacts et bien annotés.

  • Le jeu de données doit refléter étroitement vos cas d'utilisation en production.

Diversité

Incluez divers exemples qui permettent d'effectuer les opérations suivantes :

  • Couvrir la gamme complète des entrées attendues

  • Représenter différents niveaux de difficulté

  • Incluez des boîtiers et des variantes

  • Évitez de trop vous adapter à des motifs étroits

Formatage de sortie

Spécifiez clairement le format de sortie souhaité dans les réponses de l'assistant. Les exemples incluent les structures JSON, les tableaux, le format CSV ou les formats personnalisés spécifiques à votre application.

Conversations complexes
  • La perte est calculée uniquement en fonction des tours de l'assistant, et non des tours de l'utilisateur.

  • Chaque réponse de l'assistant doit être correctement formatée.

  • Maintenez la cohérence d'une conversation à l'autre.

Liste de contrôle de qualité
  • Taille de jeu de données suffisante (2 000 à 10 000 échantillons)

  • Des exemples variés couvrant tous les cas d'utilisation

  • Formatage de sortie clair et cohérent

  • Étiquettes et annotations précises

  • Représentatif des scénarios de production

  • Exempt de contradictions ou d'ambiguïtés