Configurer l'inférence pour un modèle personnalisé - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configurer l'inférence pour un modèle personnalisé

Après avoir créé un modèle personnalisé, vous pouvez configurer l'inférence à l'aide de l'une des options suivantes :

  • Achetez du débit provisionné : achetez du débit provisionné pour votre modèle afin de configurer une capacité de calcul dédiée avec un débit garanti pour des performances constantes et une latence réduite.

    Pour plus d'informations sur le débit provisionné, consultez. Augmentez la capacité d'invocation des modèles grâce au débit provisionné dans Amazon Bedrock Pour plus d'informations sur l'utilisation de modèles personnalisés avec un débit provisionné, consultez. Achetez un débit provisionné pour un modèle personnalisé

  • Déployer un modèle personnalisé pour l'inférence à la demande (Amazon Novamodèles uniquement) : pour configurer l'inférence à la demande, vous déployez le modèle avec un déploiement de modèle personnalisé. Après avoir déployé le modèle, vous l'invoquez à l'aide de l'ARN pour le déploiement du modèle personnalisé. Avec l'inférence à la demande, vous ne payez que pour ce que vous utilisez et vous n'avez pas besoin de configurer des ressources informatiques provisionnées.

    Pour plus d'informations sur le déploiement de modèles personnalisés pour l'inférence à la demande, consultezDéployez un modèle personnalisé pour une inférence à la demande.