Utiliser un déploiement pour l’inférence à la demande
Après avoir déployé votre modèle personnalisé pour l’inférence à la demande, vous pouvez l’utiliser pour générer des réponses en effectuant des demandes d’inférence. Pour les opérations InvokeModel ou Converse, vous utilisez le nom de ressource Amazon Resource Name (ARN) du déploiement comme modelId.
Pour plus d’informations sur la création de demandes d’inférence, consultez les rubriques suivantes :