Utiliser un déploiement pour l’inférence à la demande

Après avoir déployé votre modèle personnalisé pour l’inférence à la demande, vous pouvez l’utiliser pour générer des réponses en effectuant des demandes d’inférence. Pour les opérations InvokeModel ou Converse, vous utilisez le nom de ressource Amazon Resource Name (ARN) du déploiement comme modelId.

Pour plus d’informations sur la création de demandes d’inférence, consultez les rubriques suivantes :

Soumettre des invites et générer des réponses à l’aide de l’inférence de modèle
Conditions préalables à l’exécution de l’inférence de modèle
Soumettre des invites et générer des réponses à l’aide de l’API

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Déployer un modèle personnalisé

Supprimer un déploiement de modèle personnalisé