Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Ajustez les modèles Amazon Nova grâce à un réglage précis du renforcement
Avant de peaufiner le réglage, assurez-vous de remplir les conditions préalables, car Amazon Bedrock a besoin d'autorisations spécifiques pour créer et gérer le processus de mise au point. Pour obtenir des informations complètes sur la sécurité et les autorisations, consultezAccès et sécurité pour les modèles Amazon Nova.
Effectuez le réglage précis du renforcement pour les modèles Amazon Nova en 5 étapes :
-
Fournir un ensemble de données de formation : téléchargez les instructions dans le format requis (par exemple, JSONL) en tant que jeu de données d'entraînement affiné pour le renforcement. Pour de plus amples informations, veuillez consulter Préparer les données pour les modèles Amazon Nova.
-
Configurer la fonction de récompense (évaluateur) : définissez un évaluateur pour évaluer les réponses du modèle en fonction de l'exactitude, de la structure, du ton ou d'autres objectifs. La fonction de récompense peut être exécutée à l'aide de Lambda pour calculer les scores objectifs. Vous pouvez également choisir un modèle comme juge (via la console) et évaluer les réponses en fonction des critères et des principes que vous configurez (la console les convertit automatiquement en fonctions Lambda). Pour de plus amples informations, veuillez consulter Configuration des fonctions de récompense pour les modèles Amazon Nova.
-
Soumettre un travail de réglage précis du renforcement : lancez le travail de réglage précis du renforcement en spécifiant le modèle de base, le jeu de données, la fonction de récompense et d'autres paramètres facultatifs tels que les hyperparamètres. Pour de plus amples informations, veuillez consulter Créez et gérez des tâches de réglage précis pour les modèles Amazon Nova.
-
Surveillez la formation : suivez le statut du poste, les indicateurs de récompense et la progression de la formation jusqu'à la fin. Pour de plus amples informations, veuillez consulter Surveillez votre travail de formation RFT.
-
Utiliser un modèle affiné : une fois le travail terminé, déployez le modèle RFT obtenu en un clic pour une inférence à la demande. Vous pouvez également utiliser le débit provisionné pour les charges de travail critiques qui nécessitent des performances constantes. Consultez Configuration de l’inférence pour un modèle personnalisé. Utilisez Test in Playground pour évaluer et comparer les réponses avec le modèle de base.
Important
Vous pouvez fournir un maximum de 20 000 instructions à Amazon Bedrock pour renforcer et affiner le modèle.
Modèles Nova pris en charge
Le tableau suivant présente les modèles Amazon Nova que vous pouvez personnaliser grâce à un réglage précis du renforcement :
Note
Pour plus d'informations sur les autres modèles pris en charge, y compris les modèles à poids ouvert, consultezAjustez les modèles à poids ouvert à l'aide de -compatible OpenAI APIs.
| Fournisseur | Modèle | ID du modèle | Support du modèle à région unique |
|---|---|---|---|
| Amazon | Nova 2 Lite | amazon.nova-2-lite-v 1:0:256 k | us-east-1 |