Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utiliser un déploiement pour l’inférence à la demande
Après avoir déployé votre modèle personnalisé pour l’inférence à la demande, vous pouvez l’utiliser pour générer des réponses en effectuant des demandes d’inférence. Pour les opérations InvokeModel ou Converse, vous utilisez le nom de ressource Amazon Resource Name (ARN) du déploiement comme modelId.
Pour plus d’informations sur la création de demandes d’inférence, consultez les rubriques suivantes :