Fine-tune Modèles Amazon Nova avec renforcement affiné

Avant de peaufiner, assurez-vous de remplir les conditions préalables, car Amazon Bedrock a besoin d'autorisations spécifiques pour créer et gérer le processus de réglage. Pour obtenir des informations complètes sur la sécurité et les autorisations, consultezAccès et sécurité pour les modèles Amazon Nova.

Effectuez le réglage précis du renforcement pour les modèles Amazon Nova en 5 étapes :

Fournir un ensemble de données de formation : téléchargez les instructions dans le format requis (par exemple, JSONL) en tant que jeu de données d'entraînement affiné pour le renforcement. Pour de plus amples informations, veuillez consulter Préparer les données pour les modèles Amazon Nova.
Configurer la fonction de récompense (évaluateur) : définissez un évaluateur pour évaluer les réponses du modèle en fonction de l'exactitude, de la structure, du ton ou d'autres objectifs. La fonction de récompense peut être exécutée à l'aide de Lambda pour calculer les scores objectifs. Vous pouvez également choisir un modèle comme juge (via la console) et évaluer les réponses en fonction des critères et des principes que vous configurez (la console les convertit automatiquement en fonctions Lambda). Pour de plus amples informations, veuillez consulter Configuration des fonctions de récompense pour les modèles Amazon Nova.
Soumettre un travail de réglage précis du renforcement : lancez le travail de réglage précis du renforcement en spécifiant le modèle de base, le jeu de données, la fonction de récompense et d'autres paramètres facultatifs tels que les hyperparamètres. Pour de plus amples informations, veuillez consulter Créez et gérez des tâches de réglage précis pour les modèles Amazon Nova.
Surveillez la formation : suivez le statut du poste, les indicateurs de récompense et la progression de la formation jusqu'à la fin. Pour de plus amples informations, veuillez consulter Surveillez votre travail de formation RFT.
Fine-Tuned Modèle d'utilisation : une fois le travail terminé, déployez le modèle RFT obtenu en un clic pour une inférence à la demande. Vous pouvez également utiliser le débit provisionné pour les charges de travail critiques qui nécessitent des performances constantes. Consultez Configuration de l’inférence pour un modèle personnalisé. Utilisez Test in Playground pour évaluer et comparer les réponses avec le modèle de base.

Important

Vous pouvez fournir un maximum de 20 000 instructions à Amazon Bedrock pour renforcer et affiner le modèle.

Modèles Nova pris en charge

Le tableau suivant présente les modèles Amazon Nova que vous pouvez personnaliser grâce à un réglage précis du renforcement :

Note

Pour plus d'informations sur les autres modèles pris en charge, y compris les modèles à poids ouvert, consultezFine-tune modèles à poids ouvert utilisant OpenAI-API compatibles.

Modèles pris en charge pour un réglage précis du renforcement
Fournisseur	Modèle	ID du modèle	Single-region support du modèle
Amazon	Nova 2 Lite	amazon.nova-2-lite-v 1:0:256 k	us-east-1

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Peaufinage par renforcement

Accès et sécurité