Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Déployer un modèle personnalisé pour l’inférence à la demande
Une fois que vous avez créé un modèle personnalisé à l’aide d’une tâche de personnalisation de modèle (peaufinage, distillation ou pré-entraînement continu), vous pouvez configurer l’inférence à la demande pour ce modèle.
Pour configurer l’inférence à la demande pour un modèle personnalisé, vous déployez le modèle avec un déploiement de modèle personnalisé. Après avoir déployé votre modèle personnalisé, vous utilisez le Amazon Resource Name (ARN) du déploiement comme paramètre modelId dans vos opérations API InvokeModel ou Converse. Vous pouvez utiliser le modèle déployé pour l’inférence à la demande avec les fonctionnalités Amazon Bedrock telles que les terrains de jeu, les agents et les bases de connaissances.
Rubriques
Modèles pris en charge
Vous pouvez configurer l’inférence à la demande pour les modèles suivants :
-
Amazon Nova Canvas
-
Amazon Nova Lite
-
Amazon Nova Micro
-
Amazon Nova Pro