Déployer un modèle personnalisé pour l’inférence à la demande

Une fois que vous avez créé un modèle personnalisé à l’aide d’une tâche de personnalisation de modèle (peaufinage, distillation ou pré-entraînement continu), vous pouvez configurer l’inférence à la demande pour ce modèle.

Pour configurer l’inférence à la demande pour un modèle personnalisé, vous déployez le modèle avec un déploiement de modèle personnalisé. Après avoir déployé votre modèle personnalisé, vous utilisez le Amazon Resource Name (ARN) du déploiement comme paramètre modelId dans vos opérations API InvokeModel ou Converse. Vous pouvez utiliser le modèle déployé pour l’inférence à la demande avec les fonctionnalités Amazon Bedrock telles que les terrains de jeu, les agents et les bases de connaissances.

Rubriques

Modèles pris en charge

Vous pouvez configurer l’inférence à la demande pour les modèles suivants :

Amazon Nova Canvas
Amazon Nova Lite
Amazon Nova Micro
Amazon Nova Pro

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Inférence Amazon Bedrock

Déployer un modèle personnalisé