Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Débit provisionné
Lorsque vous configurez le débit provisionné pour un modèle, vous bénéficiez d'un niveau de débit à un coût fixe.
Vous pouvez utiliser le débit provisionné avec des modèles de base Amazon et tiers, ainsi qu’avec des modèles personnalisés.
La tarification du débit provisionné varie en fonction du modèle que vous utilisez et du niveau d’engagement que vous choisissez. Vous bénéficiez d’un tarif réduit lorsque vous vous engagez pour une période plus longue. Pour en savoir plus sur les tarifs de chaque modèle, consultez la page Fournisseurs de modèles
Les options de débit pour un modèle varient selon que vous exécutez l’inférence sur un modèle de base ou sur un modèle personnalisé.
Note
Dans la AWS GovCloud (US) région, vous ne pouvez acheter du débit provisionné que pour des modèles personnalisés sans engagement.
Option de tarification | Modèle de base | Modèle personnalisé |
---|---|---|
Débit provisionné, sans engagement (tarification horaire) | Non disponible | Disponible (deux débits provisionnés par compte au maximum) |
Débit provisionné, engagement d’un mois | Disponible | Disponible |
Débit provisionné, engagement de six mois | Disponible | Disponible |
Vous spécifiez le débit provisionné en unités de modèle (MU). Une unité de modèle fournit un niveau de débit spécifique pour le modèle spécifié. Le niveau de débit d’une unité de modèle pour un modèle de texte donné spécifie les éléments suivants :
Nombre total de jetons d’entrée par minute : nombre de jetons d’entrée qu’une unité de modèle peut traiter pour toutes les demandes en une minute.
Nombre total de jetons de sortie par minute : nombre de jetons de sortie qu’une unité de modèle peut générer pour toutes les demandes en une minute.
Les quotas d’unités de modèle dépendent du niveau d’engagement que vous spécifiez pour le débit provisionné.
-
Pour les modèles personnalisés sans engagement, un quota d’une unité de modèle est disponible pour chaque débit provisionné. Vous pouvez créer jusqu’à deux débits provisionnés par compte.
-
Pour les modèles de base ou les modèles personnalisés avec engagement, le quota par défaut est de 0 unité de modèle. Pour demander une augmentation, utilisez le formulaire de demande d’augmentation de limite
.