Réglage précis supervisé sur 2.0 Amazon Nova - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Réglage précis supervisé sur 2.0 Amazon Nova

Présentation de

Amazon NovaLes données SFT 2.0 utilisent le même format d'API Converse que la Amazon Nova version 1.0, avec l'ajout de champs de contenu de raisonnement facultatifs. Pour les spécifications de format complètes, voir le schéma ReasoningContentBlockde l'API Converse.

Fonctionnalités prises en charge

  • Types de saisie : texte, image ou vidéo dans les blocs de contenu utilisateur

  • Contenu de l'assistant — Réponses sous forme de texte uniquement et contenu de raisonnement

  • Composition du jeu de données — Doit être homogène. Choisissez l'une des options suivantes : virages textuels uniquement, tournages texte+image ou texte+vidéo

Important

Vous ne pouvez pas mélanger des images et des vidéos dans le même jeu de données ou sur différents tours.

Limitations actuelles

  • Utilisation des outils — Bien que l'utilisation des outils soit prise en charge dans le format d'entrée, elle n'est actuellement pas prise en charge par Amazon Nova 2.0 SFT. L'ajout de sections d'outils peut entraîner l'échec de votre tâche.

  • Contenu de raisonnement multimodal — Bien que le format Converse prenne en charge le contenu de raisonnement basé sur des images, celui-ci n'est pas pris en charge par Amazon Nova 2.0 SFT.

  • Ensembles de validation — La fourniture d'un ensemble de validation peut être prise en charge via l'interface utilisateur mais ne le sera pas pendant la formation SFT.

Formats multimédias pris en charge

  • Images — PNG, JPEG, GIF

  • Vidéos — MOV, MKV, MP4

Exemples de formats de données

Text-only

Cet exemple montre un format texte de base compatible avec Amazon Nova la version 1.0.

{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a digital assistant with a friendly personality" } ], "messages": [ { "role": "user", "content": [ { "text": "What country is right next to Australia?" } ] }, { "role": "assistant", "content": [ { "text": "The closest country is New Zealand" } ] } ] }
Text with reasoning

Cet exemple montre du texte avec un contenu de raisonnement facultatif pour la Amazon Nova version 2.0.

{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a digital assistant with a friendly personality" } ], "messages": [ { "role": "user", "content": [ { "text": "What country is right next to Australia?" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "I need to use my world knowledge of geography to answer this question" } } }, { "text": "The closest country to Australia is New Zealand, located to the southeast across the Tasman Sea." } ] } ] }
Note

Actuellement, seul reasoningText est pris en charge au sein dereasoningContent. Le contenu du raisonnement multimodal n'est pas encore disponible.

Image + text

Cet exemple montre comment inclure une entrée d'image dans du texte.

{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a helpful assistant." } ], "messages": [ { "role": "user", "content": [ { "image": { "format": "jpeg", "source": { "s3Location": { "uri": "s3://your-bucket/your-path/your-image.jpg", "bucketOwner": "your-aws-account-id" } } } }, { "text": "Which country is highlighted in the image?" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "I will determine the highlighted country by examining its location on the map and using my geographical knowledge" } } }, { "text": "The highlighted country is New Zealand" } ] } ] }
Video + text

Cet exemple montre comment inclure une entrée vidéo dans du texte.

{ "schemaVersion": "bedrock-conversation-2024", "system": [ { "text": "You are a helpful assistant." } ], "messages": [ { "role": "user", "content": [ { "video": { "format": "mp4", "source": { "s3Location": { "uri": "s3://your-bucket/your-path/your-video.mp4", "bucketOwner": "your-aws-account-id" } } } }, { "text": "What is shown in this video?" } ] }, { "role": "assistant", "content": [ { "reasoningContent": { "reasoningText": { "text": "I will analyze the video content to identify key elements" } } }, { "text": "The video shows a map with New Zealand highlighted" } ] } ] }

Modes de raisonnement et de non-raisonnement

Comprendre le contenu du raisonnement : le contenu du raisonnement (également appelé chain-of-thought) capture les étapes de réflexion intermédiaires du modèle avant de générer une réponse finale. À votre assistant tour, utilisez le reasoningContent champ pour inclure ces traces de raisonnement.

Comment est calculée la perte :

  • Avec un contenu de raisonnement — La perte d'entraînement inclut à la fois des jetons de raisonnement et des jetons de résultat final

  • Sans raisonnement, contenu : la perte d'entraînement est calculée uniquement sur les jetons de sortie finaux

Vous pouvez inclure reasoningContent plusieurs tours d'assistant dans des conversations à plusieurs tours.

Quand activer le mode raisonnement

Définissez reasoning_enabled: true dans votre configuration d'entraînement le moment où vous souhaitez que le modèle génère des jetons de réflexion avant de produire les résultats finaux ou si vous avez besoin de meilleures performances pour des tâches de raisonnement complexes.

Note

Vous pouvez activer le mode raisonnement, que vos données d'entraînement contiennent ou non du contenu de raisonnement. Cependant, il est recommandé d'inclure des traces de raisonnement dans vos données d'entraînement afin que le modèle puisse tirer des leçons de ces exemples et améliorer la qualité du raisonnement.

À définir reasoning_enabled: false lorsque vous vous entraînez sur des tâches simples qui ne nécessitent pas d'étapes de raisonnement explicites ou lorsque vous souhaitez optimiser la vitesse et réduire l'utilisation de jetons.

Directives de formatage

  • Utilisez du texte brut pour raisonner le contenu.

  • Évitez les balises de balisage telles que <thinking> et </thinking> sauf si cela est spécifiquement requis par votre tâche.

  • Assurez-vous que le contenu du raisonnement est clair et pertinent pour le processus de résolution des problèmes.

Génération de données de raisonnement

Si votre jeu de données ne contient pas de traces de raisonnement, vous pouvez les créer à l'aide d'un modèle capable de raisonner tel que. Fournissez vos paires d'entrées-sorties au modèle et capturez son processus de raisonnement pour créer un ensemble de données augmenté par le raisonnement.

Utiliser des jetons de raisonnement pour l'entraînement

Lorsque le mode raisonnement est activé lors de l'entraînement, le modèle apprend à séparer le raisonnement interne de la réponse finale. Le processus de formation effectue les opérations suivantes :

  • Organise les données sous forme de triples : saisie, raisonnement et réponse

  • Optimise à l'aide de la prédiction standard du jeton suivant les pertes causées à la fois par les jetons de raisonnement et de réponse

  • Encourage le modèle à raisonner en interne avant de générer des réponses

Contenu de raisonnement efficace

Un contenu de raisonnement de haute qualité doit inclure les éléments suivants :

  • Réflexions et analyses intermédiaires

  • Déductions logiques et étapes d'inférence

  • Step-by-step approches de résolution de problèmes

  • Liens explicites entre les étapes et les conclusions

Cela aide le modèle à développer la capacité de réfléchir avant de répondre.

Directives pour la préparation des jeux

Le tableau suivant fournit des instructions pour préparer votre jeu de données d'entraînement.

Directives pour la préparation des jeux

Ligne directrice Description
Taille et qualité
  • Taille recommandée : 2 000 à 10 000 échantillons

  • Échantillons minimum : 200

  • Privilégiez la qualité à la quantité. Assurez-vous que les exemples sont exacts et bien annotés.

  • Le jeu de données doit refléter étroitement vos cas d'utilisation en production.

Diversité

Incluez divers exemples qui permettent d'effectuer les opérations suivantes :

  • Couvrir la gamme complète des entrées attendues

  • Représenter différents niveaux de difficulté

  • Incluez des boîtiers et des variantes

  • Évitez de trop vous adapter à des motifs étroits

Formatage de sortie

Spécifiez clairement le format de sortie souhaité dans les réponses de l'assistant. Les exemples incluent les structures JSON, les tableaux, le format CSV ou les formats personnalisés spécifiques à votre application.

Conversations complexes
  • La perte est calculée uniquement en fonction des tours de l'assistant, et non des tours de l'utilisateur.

  • Chaque réponse de l'assistant doit être correctement formatée.

  • Maintenez la cohérence d'une conversation à l'autre.

Liste de contrôle de qualité
  • Taille de jeu de données suffisante (2 000 à 10 000 échantillons)

  • Des exemples variés couvrant tous les cas d'utilisation

  • Formatage de sortie clair et cohérent

  • Étiquettes et annotations précises

  • Représentatif des scénarios de production

  • Exempt de contradictions ou d'ambiguïtés