Configuration de l’inférence pour un modèle personnalisé - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration de l’inférence pour un modèle personnalisé

Une fois le modèle personnalisé créé, vous pouvez configurer l’inférence à l’aide de l’une des options suivantes :

  • Acheter du débit provisionné : achetez du débit provisionné pour votre modèle afin de configurer une capacité de calcul dédiée avec un débit garanti pour des performances constantes et une latence réduite.

    Pour plus d’informations sur le débit provisionné, consultez Augmentez la capacité d'invocation des modèles grâce au débit provisionné dans Amazon Bedrock. Pour plus d’informations sur l’utilisation des modèles personnalisés avec débit provisionné, consultez Achat de débit provisionné pour un modèle personnalisé.

  • Déployer un modèle personnalisé pour l’inférence à la demande : pour configurer l’inférence à la demande, vous déployez le modèle avec un déploiement de modèles personnalisés. Une fois le modèle déployé, vous pouvez l’invoquer à l’aide de l’ARN pour déployer le modèle personnalisé. Avec l’inférence à la demande, vous ne payez que pour ce que vous utilisez et vous n’avez pas besoin de configurer des ressources informatiques provisionnées.

    Pour plus d’informations sur le déploiement de modèles personnalisés pour l’inférence à la demande, consultez Déploiement d’un modèle personnalisé pour une inférence à la demande.